免费 AI “神器”系列第三弹:AI 视频领域的“字节跳动”诞生,首个GPT-4V盲测工具发布|钛媒体AGI 免费 AI “神器”系列第三弹:AI 视频领域的“字节跳动”诞生,首个GPT-4V盲测工具发布|钛媒体AGI
admin
2024-02-13 08:36:53
0


图片来源:unsplash

近期,生成式人工智能(AIGC)领域又涌现出多款创意十足的新应用。

今天,钛媒体AGI梳理了免费 AI “神器”系列第三弹,共五款,其中大多数实用工具能帮你提升一定的生产力。

AI视频编辑神器——Runway Gen-2胸部x光片诊断神器——CheXagentAlphaZero升级版——DeepMind下象棋模型Vision Arena:视觉模型盲测工具图片3D转换器——ComfyUI 3D Pack1、AI 视频编辑神器——Runway Gen-2

产品信息:Runway Gen-2是一款功能强大的AI视频编辑软件,用户可以直接使用“文本”、“图片”和“文本+图片”三种方式提示生成视频内容,并自动剪辑视频。

产品功能:用户在主界面可自由选择“文本”、“图片”和“文本+图片”三种方式来生成视频内容。以“文本”生成视频为例,在输入框输入一段描述词后,等待两分钟左右就会生成一段4秒的视频内容。

除此之外,Runway Gen-2还配备有其他30种强大的 AI 工具,比如:“Remove Background”(绿幕去背景)、“Expand Image”(图片扩展)、“Blur Faces”(模糊人脸)、“Inpainting”(移除视频杂物/人)等,可以帮助视频内容创作者极大提高工作效率。



Runway Gen-2配备有30种 AI 功能

据悉,Runway Gen-2背后的开发团队来自Runway公司,他们致力于开发用于生成视频、图像和多媒体内容的产品和模型。在2023年6月,该公司以15亿美元的估值,完成了1.41亿美元的C轮融资,谷歌、英伟达等科技巨头都参与了投资,被誉为“AI 视频生成领域的字节跳动”。

Runway Gen-2首席执行官Cristobal Valenzuela曾表示,“创意软件的时代已经结束。”而有科技博主认为:“如果(Runway)按照这个速度发展下去,到2024年底,我们或许能够看到导演们手工制作出好莱坞水准的生成式视频作品。”

体验链接:https://app.runwayml.com/

2、胸部x光片诊断神器——CheXagent

产品信息:CheXagent是一个专门用来解读胸部x光片的AI模型,旨在提高医疗影像诊断效率与准确性。

产品功能:用户只需在CheXagent主界面上传一张胸部x光片,等待数秒后即可生成相关的诊断结果,包括疾病识别、异常检测、重要结构分析以及后续步骤建议。


CheXagent 界面

CheXagent由斯坦福大学与Stability AI合作开发,结合了临床医学大语言模型、视觉编码器和视觉-语言桥接网络,利用超过600万组数据的大型集合进行训练,提升了解读X光图像的能力。如若未来进入大规模应用,医疗工作者的工作效率和诊断准确率都将得到提升。

体验链接:https://stanford-aimi.github.io/chexagent.html

3、AlphaZero升级版——DeepMind下象棋模型

产品信息:Google DeepMind抛弃传统的搜索方法,使用Transformer模型,训练了一个AI模型来下国际象棋。

产品功能:Google DeepMind下象棋模型使用了一个国际象棋程序Stockfish 16来训练,AI不再需要像此前普通 AI 国际象棋依赖于搜索算法来预测和评估最佳选择的走法,而是直接学习成千上万棋局中的模式和策略,达到只需通过观察当前棋盘的状态,做出高水平决策的大师级棋艺。

DeepMind下象棋模型相关论文

该模型在性能上超越了AlphaGo Zero和GPT-3.5-Turbo-Instruct,证明了深度学习模型,特别是Transformer模型,能够在复杂的决策和策略游戏中学习和模拟高级人类智能,显著减少了计算需求,为AI的自主学习和理解复杂系统提供了新的范例。

与AI下棋体验地址:https://lichess.org/

4、Vision Arena:视觉模型盲测工具

产品信息:Vision Arena是一款视觉模型领域的开放评测对比平台,目的是测试和比较不同的视觉语言模型(VLMs),比如GPT-4V、Gemini(谷歌模型)、Llava、Qwen-VL(通义模型)等。

产品功能:用户可以在Vision Arena工具上同时测试两个视觉模型,并对它们进行投票,以决定哪个更优秀。而且整个过程处于“盲测”状态,需要选择你认为好的结果才会告诉你模型是什么。



据透露,这是全球首个GPT-4V的盲测工具软件。未来,基于该工具的模型基准排行榜(Elo Rating)功能也将推出。

体验地址:https://huggingface.co/spaces/WildVision/vision-arena

5、图片3D转换器——ComfyUI 3D Pack

产品信息:ComfyUI 是一款基于稳定扩散模型(Stable Diffusion Model)架构技术,直观、功能强大且实现模块化的图形平台,允许用户创建复杂的 AI 文生图工作,无需编程知识。

产品功能:今年1月,ComfyUI 宣布引入3D图像处理模型,能快速将图片转换成3D模型。如今,用户可在ComfyUI 3D Pack平台上将图片快速转换成一个3D模型,并能从不同角度查看该3D模型,还能使用3D高斯扩散技术提升模型质量,让3D模型看起来更加真实和具有立体感。此外,ComfyUI 3D Pack还支持多种格式导出,集成了先进的3D处理算法。


ComfyUI 3D Pack界面

体验地址:https://github.com/MrForExample/ComfyUI-3D-Pack/tree/main

(本文首发钛媒体App,作者|任颖文,编辑|林志佳)

相关内容

热门资讯

白银期货暴涨9%,白银基金暂停... 来源:21世纪经济报道 国投白银LOF最新公告,将于1月28日起暂停申购(含定期定额投资)业务。 ...
投机永不眠!加密货币失宠 币圈... 来源:智通财经网 加密货币市场的参与者如今正在大举转向预测市场。这种转向反映了机遇与倦怠并存。比特币...
专业分阶分龄内容的母婴平台和侧... 概述 在母婴垂直领域,不同平台基于自身定位,在功能侧重、用户群体和运营模式上存在差异。以下以妈妈网、...
一年“生活消费”2.9万亿元 ... 中新网郑州1月26日电 (阚力 王佳宁)2025年,河南省社会消费品零售总额2.9万亿元(人民币,下...
家居旧改市场潜力大 政策需求共... 当下存量房市场主导行业发展,国家“以旧换新”“好房子”政策持续加码,叠加居民居住品质升级需求,旧改市...
美国稀土上市公司披露获特朗普政... 财联社1月26日讯(编辑 史正丞)北京时间周一晚间,上周末引发市场关注的“美国政府入股美国稀土公司(...
光电股份:预计2025年度净利... 每经AI快讯,光电股份1月26日晚间发布业绩预告,公司预计2025年度实现归属于母公司所有者的净利润...
稀土价格持续上涨,行业龙头扭亏... 【大河财立方消息】1月26日,中国稀土集团资源科技股份有限公司(证券简称:中国稀土)发布2025年年...
掘金K12教育融资赛道:哪家服... 一、引言:政策与市场双轮驱动,K12教育融资需求迫切 1.1 K12教育行业融资现状与痛点 当前K...
美股金矿股,全线上涨 新闻荐读 1月26日,美股三大指数开盘涨跌不一,道琼斯指数涨0.38%,标普500指数涨0.24%,...
银行积存金业务紧急调整!工行、... 新京报贝壳财经讯(记者姜樊)1月26日,国际黄金价格再创历史新高。纽约商品交易所黄金期货价格和伦敦现...
国际金价突破每盎司5100美元 当地时间1月26日,国际黄金价格再创历史新高,纽约商品交易所黄金期货价格和伦敦现货黄金价格盘中双双突...
广东预期2026年地区生产总值... 每经记者|孔泽思 每经编辑|袁东 |2026年1月27日 星期二| NO.1广东经济总量连续37年...
原创 特... 全球金融格局风云变幻,一场悄无声息的“去美元化”浪潮正席卷而来。各国央行与大型养老基金的举动,如同秋...
原创 今... 2026年01月26日,国内黄金市场呈现高位震荡态势,国际现货黄金每盎司价格达到4986.53美元,...
消费首破50万亿元背后   数据显示,2025年我国社会消费品零售总额达到50.1万亿元,增长3.7%,消费对经济增长的贡献...
莲华资产洪灏:黄金成为全球资产... 近期黄金价格大幅走强,并带动有色金属板块稳健上行。2026年A股金属板块走势将如何演绎?投资者又应如...
飞阅楼市第210期丨本土“三驾... 文/青岛日报李鹏飞 2021-2025年,中国房地产行业迎来深度调整的“阵痛期”,青岛楼市在这一轮周...
突发!妙可蓝多创始人被免职并被... 【导读】妙可蓝多公告,柴琇被免去副董事长、总经理及法定代表人职务 中国基金报记者 郑俊婷 虽然妙可...
穿越周期的力量:2025中国企... 责编 | 贾宁排版| 沐言 第 9411 篇深度好文:20094字 |25分钟阅读 商业人物 笔记君...