免费 AI “神器”系列第三弹:AI 视频领域的“字节跳动”诞生,首个GPT-4V盲测工具发布|钛媒体AGI 免费 AI “神器”系列第三弹:AI 视频领域的“字节跳动”诞生,首个GPT-4V盲测工具发布|钛媒体AGI
admin
2024-02-13 08:36:53
0


图片来源:unsplash

近期,生成式人工智能(AIGC)领域又涌现出多款创意十足的新应用。

今天,钛媒体AGI梳理了免费 AI “神器”系列第三弹,共五款,其中大多数实用工具能帮你提升一定的生产力。

AI视频编辑神器——Runway Gen-2胸部x光片诊断神器——CheXagentAlphaZero升级版——DeepMind下象棋模型Vision Arena:视觉模型盲测工具图片3D转换器——ComfyUI 3D Pack1、AI 视频编辑神器——Runway Gen-2

产品信息:Runway Gen-2是一款功能强大的AI视频编辑软件,用户可以直接使用“文本”、“图片”和“文本+图片”三种方式提示生成视频内容,并自动剪辑视频。

产品功能:用户在主界面可自由选择“文本”、“图片”和“文本+图片”三种方式来生成视频内容。以“文本”生成视频为例,在输入框输入一段描述词后,等待两分钟左右就会生成一段4秒的视频内容。

除此之外,Runway Gen-2还配备有其他30种强大的 AI 工具,比如:“Remove Background”(绿幕去背景)、“Expand Image”(图片扩展)、“Blur Faces”(模糊人脸)、“Inpainting”(移除视频杂物/人)等,可以帮助视频内容创作者极大提高工作效率。



Runway Gen-2配备有30种 AI 功能

据悉,Runway Gen-2背后的开发团队来自Runway公司,他们致力于开发用于生成视频、图像和多媒体内容的产品和模型。在2023年6月,该公司以15亿美元的估值,完成了1.41亿美元的C轮融资,谷歌、英伟达等科技巨头都参与了投资,被誉为“AI 视频生成领域的字节跳动”。

Runway Gen-2首席执行官Cristobal Valenzuela曾表示,“创意软件的时代已经结束。”而有科技博主认为:“如果(Runway)按照这个速度发展下去,到2024年底,我们或许能够看到导演们手工制作出好莱坞水准的生成式视频作品。”

体验链接:https://app.runwayml.com/

2、胸部x光片诊断神器——CheXagent

产品信息:CheXagent是一个专门用来解读胸部x光片的AI模型,旨在提高医疗影像诊断效率与准确性。

产品功能:用户只需在CheXagent主界面上传一张胸部x光片,等待数秒后即可生成相关的诊断结果,包括疾病识别、异常检测、重要结构分析以及后续步骤建议。


CheXagent 界面

CheXagent由斯坦福大学与Stability AI合作开发,结合了临床医学大语言模型、视觉编码器和视觉-语言桥接网络,利用超过600万组数据的大型集合进行训练,提升了解读X光图像的能力。如若未来进入大规模应用,医疗工作者的工作效率和诊断准确率都将得到提升。

体验链接:https://stanford-aimi.github.io/chexagent.html

3、AlphaZero升级版——DeepMind下象棋模型

产品信息:Google DeepMind抛弃传统的搜索方法,使用Transformer模型,训练了一个AI模型来下国际象棋。

产品功能:Google DeepMind下象棋模型使用了一个国际象棋程序Stockfish 16来训练,AI不再需要像此前普通 AI 国际象棋依赖于搜索算法来预测和评估最佳选择的走法,而是直接学习成千上万棋局中的模式和策略,达到只需通过观察当前棋盘的状态,做出高水平决策的大师级棋艺。

DeepMind下象棋模型相关论文

该模型在性能上超越了AlphaGo Zero和GPT-3.5-Turbo-Instruct,证明了深度学习模型,特别是Transformer模型,能够在复杂的决策和策略游戏中学习和模拟高级人类智能,显著减少了计算需求,为AI的自主学习和理解复杂系统提供了新的范例。

与AI下棋体验地址:https://lichess.org/

4、Vision Arena:视觉模型盲测工具

产品信息:Vision Arena是一款视觉模型领域的开放评测对比平台,目的是测试和比较不同的视觉语言模型(VLMs),比如GPT-4V、Gemini(谷歌模型)、Llava、Qwen-VL(通义模型)等。

产品功能:用户可以在Vision Arena工具上同时测试两个视觉模型,并对它们进行投票,以决定哪个更优秀。而且整个过程处于“盲测”状态,需要选择你认为好的结果才会告诉你模型是什么。



据透露,这是全球首个GPT-4V的盲测工具软件。未来,基于该工具的模型基准排行榜(Elo Rating)功能也将推出。

体验地址:https://huggingface.co/spaces/WildVision/vision-arena

5、图片3D转换器——ComfyUI 3D Pack

产品信息:ComfyUI 是一款基于稳定扩散模型(Stable Diffusion Model)架构技术,直观、功能强大且实现模块化的图形平台,允许用户创建复杂的 AI 文生图工作,无需编程知识。

产品功能:今年1月,ComfyUI 宣布引入3D图像处理模型,能快速将图片转换成3D模型。如今,用户可在ComfyUI 3D Pack平台上将图片快速转换成一个3D模型,并能从不同角度查看该3D模型,还能使用3D高斯扩散技术提升模型质量,让3D模型看起来更加真实和具有立体感。此外,ComfyUI 3D Pack还支持多种格式导出,集成了先进的3D处理算法。


ComfyUI 3D Pack界面

体验地址:https://github.com/MrForExample/ComfyUI-3D-Pack/tree/main

(本文首发钛媒体App,作者|任颖文,编辑|林志佳)

相关内容

热门资讯

哈易购APP非法期货交易欺骗投...   哈易购APP宣传可做白银铂金贵金属订购交易,但实际上并没有取得相关交易资质!哈易购APP本质上就...
消息称百度旗下昆仑芯瞄准500... 6 月 29 日消息,据《The Information》昨日援引知情人士消息,百度旗下 AI 芯片...
打造夏日消费新场景 第35届北... 北京商报讯(记者 翟枫瑞)6月29日消息,第35届北京国际燕京啤酒文化节新闻发布会在京举行。本届啤酒...
社保基金持仓数据出炉,一季度增... 最近各大上市公司一季度财报都公开了,咱们国家社保基金的持仓数据也全部曝光。目前社保拿着比亚迪价值44...
36氪首发 | 海思、中兴团队... 作者 | 乔钰杰 编辑 | 袁斯来 硬氪获悉,广州宸思通讯科技有限公司(以下简称“宸思科技”)近日完...
两天蒸发47亿市值!一纸税务通... 一纸税务通知书,能让一家百亿龙头两天蒸发47亿市值。 6月22日,北大荒(600598.SH)公告称...
SK海力士将投资1100万亿韩... SK集团会长崔泰源6月29日在韩国“三大重大计划”发布会上宣布,公司将投资1100万亿韩元扩大半导体...
两只A股,终止上市! 两家A股公司,即将摘牌。 6月29日,退市沪科(600608.SH)公告称,上海证券交易所将在202...
原创 M... 一家成立近十年的自动驾驶公司,在IPO时吸引了14家基石投资者认购近一半的发行股份,其中不乏奔驰、比...
基金忠言|国寿安保滤镜碎,三年... 图片来源:视觉中国 蓝鲸新闻6月29日讯(记者 祁和忠)保险系基金公司国寿安保总经理换人了。 6月2...
三星电机计划加码玻璃基板!相关... 6月29日,玻璃基板概念股午后有所回升, 华工科技(000988.SZ)逼近涨停, 彩虹股份(600...
拉萨海关持续壮大外贸经营主体 ...   新华网拉萨6月28日电(记者蒋梦辰)近日,记者从拉萨海关获悉,今年前5个月,西藏有进出口实绩的外...
机构:二季报临近,医药生物板块... 6月29日,华源证券发布了一篇医药生物行业的研究报告,报告指出,业绩期临近,产业链景气度有望再次迎来...
每日收评科创50放量涨超4.5... 财联社6月29日讯,三大指数全线收红,创业板指探底回升,科创50指数大涨4.61%。沪深两市成交额3...
6月多地土拍结构性升温:深圳单... 进入2026年6月,不少城市核心区地块集中诞生高溢价宗地,热度突出的城市包含深圳、杭州、长沙。 其中...
业绩炸裂!盛达资源半年预盈3.... 6月29日,贵金属矿山龙头盛达资源(000603.SZ)发布 2026 年半年度业绩预告,上半年业绩...
A股午后拉升三大股指收涨:半导... A股三大股指6月29日开盘涨跌互现。早盘沪强深弱,创指一度跌超2%。半导体午后拉升,带动两市上涨,沪...
原创 空... 前言 大家好,我是老金。 这几天,两幅极度割裂的画面放在一起,把我看笑了。 一边是在持续的热浪下,欧...
澳大利亚审慎监管局拟放宽银行风... 澳大利亚审慎监管局(APRA)6月29日就修改 银行信用风险资本设定公开征求意见,旨在加大信贷投放以...