浙商证券:OpenAI&谷歌相继发力 有望引领多模态大模型浪潮 浙商证券:OpenAI 浙商证券股票开户
admin
2024-02-17 10:45:23
0

智通财经APP获悉,OpenAI 发布文生视频模型 Sora,可遵循用户的指示生成长达一分钟的视频,并保持视觉质量。浙商证券发布研报称,OpenAI 发布 Sora 模型,有望开启多模态大模型的新一轮浪潮。

以下为研报摘要:

近日,OpenAI 发布文生视频模型 Sora,可遵循用户的指示生成长达一分钟的视频,并保持视觉质量;而谷歌发布 Gemini 1.5 Pro 大模型,可支持超长文本上下文推理,并且多模态能力表现优异,可精确捕捉电影视频细节。我们认为在 OpenAI、谷歌的引领下,有望开启多模态大模型的新一轮浪潮。

OpenAI 发布 Sora 文生视频模型,可生成最长一分钟视频

北京时间 2024 年 2 月 16 日,OpenAI 发布文生视频模型 Sora,可遵循用户的指示生成长达一分钟的视频,并保持视觉质量。Sora 能够生成包含多个角色、特定类型的动作以及主体和背景的准确细节的复杂场景。在 OpenAI 官网上可看到多个由 Sora 模型生成的视频案例,如时尚女子在东京街头、猛犸象在雪原上行走、在艺术馆中边走边欣赏艺术品等等;

Sora 模型基于 DALL-E 和 GPT 模型研究成果,可实现视频加工、拼接等功能

除了基于文本生成视频的能力,Sora 模型也可以接受其他输入,例如预先存在的图像或视频。Sora 能够执行多种图像和视频编辑任务,如创建循环视频、为静态图像添加动画、将视频向前或向后延伸、将两段视频进行拼接等。

OpenAI 官方技术文档指出,研究人员探索了生成模型在视频数据上的大规模训练,并在时长、分辨率和宽高比可变的视频和图像上联合训练了文本条件下的扩散模型。与大语言模型使用文本 Token 不同的是,Sora 模型使用了视觉补丁(Visual Patches)方法,OpenAI 证明了这种视觉补丁的方法在视频/图像生成模型中非常有用。

谷歌发布 Gemini 1.5 Pro 大模型,长文本及多模态推理能力出色

美国时间 2024 年 2 月 15 日,谷歌发布基于 MoE 架构的 Gemini 1.5 Pro 大模型,是基于前期发布的 Gemini 1.0 Pro 的更新版本。大模型在处理 530,000 token 文本时,能够实现 100%的检索完整性,在处理 1,000,000 token 的文本时也可达到 99.7% 的检索完整性。在多模态能力方面,Gemini 1.5 Pro 能够分别在约 11 小时的音频资料和大约 3 小时的视频内容中,100%成功检索到各种隐藏的音频片段或视觉元素。根据谷歌官网信息,Gemini 1.5 Pro 可实现对阿波罗 11 号的 402 页飞行记录、或是 44 分钟的无声电影内容的准确推理。

看好 2024 年多模态大模型以及大模型在 3D 建模、视频领域迎来爆发

我们在 2023 年 11 月 15 日发布的《大地回春,百花齐放——计算机行业 2024 年度策略》中提出,2024 年国内外厂商有望发布更加复杂的多模态大模型,实现文本、语音、图像以及音视频等多模态数据的复杂处理和交互。我们认为 OpenAI 发布 Sora 模型,有望开启多模态大模型的新一轮浪潮。

相关内容

热门资讯

直线涨停!多股午后异动! 今日,A股强势上攻。科创综指大涨3.37%,再创历史新高;上证指数突破4200点,创近11年新高;深...
什么情况?白银突然暴涨7%逼近... 贵金属市场本周开局表现强劲。尽管围绕美伊和平谈判的最新进展再度受挫,白银价格仍升至两个月高位。 现货...
芯原股份20cm涨停,寒武纪涨... 半导体板块全线走强。芯原股份20cm涨停,寒武纪涨超17%,科创人工智能ETF易方达、科创人工智能E...
现金、动销与未来:五粮液的转身... 2026年4月30日,年报最后截止日,五粮液一纸会计差错更正公告,将2025前三季度营收从609.4...
动荡中的“压舱石”:顶级豪宅为... 文/乐居财经 严明会 “我们梳理了九大‘不确定因素’场景。虽然它们不在基准预测之列,但任何一个若兑现...
AI“三剑客”压阵!小摩:下半... 自2025年以来,新兴市场股市相对发达市场的超额收益已达25%。 这可能仅仅是开始。摩根大通认为,本...
【IPO追踪】胜宏科技(024... 5月11日,AI PCB龙头胜宏科技(02476.HK)大涨13.67%创上市以来新高,市值一举突破...
一周融资汇总:热度不减,11家... 上周(5.5-5.11)机器人行业持续迎来资本热潮。《智能新观察》基于公开信息的不完全统计,梳理出5...
原创 股... 股息到账的喜悦还未褪去,手机突然弹出一条银行扣款短信——“红利差异税扣缴xxx元”。不少股民都经历过...
注意!“三类情形”不合规发票不... “三类情形”不合规发票不能报销,这些风险点要避开! 不符合规定的发票不可以作为报销凭证,任何单位和个...
4月份CPI同比上涨1.2% 5月11日,河北石家庄,顾客在一超市内购买蔬菜。5月11日,国家统计局发布数据显示,4月份,受国际原...
轻舟智航CEO于骞:有智驾的车... 【CNMO科技消息】近日,轻舟智航联合创始人、董事长兼CEO于骞在与凤凰网财经《发现新势力》对话时,...
“双十”增长开局!宁波银行20... 近日,随着宁波银行2026年一季报及2025年年报的相继披露,这家城商行“领头羊”展现出强劲的发展韧...
原创 火... 斑马消费 范建 火锅主业增长触顶,影响资本市场信心。海底捞将破局筹码,押在了多品牌孵化之上。 202...
原创 夯... 作者|娅沁 声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。 近两年,年轻人中开始...
美伊谈判再挫金价,市场转向交易... 据央视新闻,当地时间5月10日,美国总统特朗普在社交媒体表示,伊朗方面的回应“完全不可接受”。据新华...
宗馥莉罢免销售负责人 图片拍摄:界面新闻 赵晓娟 界面新闻记者 |赵晓娟 界面新闻编辑 |牙韩翔 娃哈哈和宏胜饮料...
直击茅台业绩说明会!回应营收确... 【导读】贵州茅台5月11日召开业绩说明会 中国基金报记者 郑俊婷 5月11日下午,贵州茅台在线上召开...
大跌41.8% 智能音箱市场遇... 快科技5月11日消息,最新行业数据显示,2026年第一季度国内智能音箱线上市场行情很冷,整体销量直接...
贵州茅台业绩会直面营利波动,王... 茅台直面了外界关注的诸多核心问题。 图片来源:贵州茅台官微 5月11日,贵州茅台酒股份有限公司(6...