元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入 元象大模型体验 元象大模型
admin
2024-04-28 19:26:47
0


人类获取的信息83%来自视觉,图文多模态大模型能感知更丰富和精确的真实世界信息,构建更全面的认知智能,从而向AGI(通用人工智能)迈出更大步伐。

元象今日发布多模态大模型 XVERSE-V ,支持任意宽高比图像输入,在主流评测中效果领先。该模型全开源,无条件免费商用,持续推动海量中小企业、研究者和开发者的研发和应用创新。

XVERSE-V 性能优异,在多项权威多模态评测中超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。


图. 多模态大模型综合评测

1
融合整体和局部的高清图像表示

传统的多模态模型的图像表示只有整体,XVERSE-V 创新性地采用了融合整体和局部的策略,支持输入任意宽高比的图像。兼顾全局的概览信息和局部的细节信息,能够识别和分析图像中的细微特征,看的更清楚,理解的更准确。



注:Concate* 表示按列进行拼接

这样的处理方式使模型可以应用于广泛的领域,包括全景图识别、卫星图像、古文物扫描分析等。

示例- 高清全景图识别 、图片细节文字识别



免费下载大模型

Hugging Face:https://huggingface.co/xverse/XVERSE-V-13B

ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-V-13B

Github:https://github.com/xverse-ai/XVERSE-V-13B

问询发送:opensource@xverse.cn

微信添加:lixing_lixing

元象持续打造国内开源标杆,在国内最早开源最大参数65B 、全球最早开源最长上下文256K 以及 国际前沿的MoE模型, 并在SuperCLUE测评全国领跑。此次推出MoE模型, 填补国产开源空白,更将其 推向了国际领先水 平。

商业应用上,元象大模型是 广东最早获得国家备案的模型之一 ,可向全社会提供服务。元象大模型去年起已和多个腾讯产品,包括QQ音乐 、虎牙直播、全民K歌、腾讯云等,进行深度合作与应用探索,为文化、娱乐、旅游、金融领域打造创新领先的用户体验。


2
多方向实际应用表现突出

模型不仅在基础能力上表现出色,在实际的应用场景中也有着出色的表现。具备不同场景下的理解能力,能够处理信息图、文献、现实场景、数理题目、科学文献、代码转化等不同需求。

图表理解

不论是复杂图文结合的信息图理解,还是单一图表的分析与计算,模型都能够自如应对。



视障真实场景

在真实视障场景测试集VizWiz中,XVERSE-V 表现出色,超过了InternVL-Chat-V1.5、DeepSeek-VL-7B 等几乎所有主流的开源多模态大模型。该测试集包含了来自真实视障用户提出的超过31,000个视觉问答,能准确反映用户的真实需求与琐碎细小的问题,帮助视障人群克服他们日常真实的视觉挑战。


VizWiz测试示例

看图内容创作

XVERSE-V 具备多模态能力的同时保持强大的文本生成能力,能够很好胜任理解图像后创造性文本生成的任务。


教育解题

模型具备了广泛的知识储备和逻辑推理能力,能够识别图像解答不同学科的问题。


百科解答

模型储备了历史、文化、科技、安全等各类主题的知识。


代码撰写


自动驾驶


情感理解与识别


元象公司介绍

一元复始,万象更新。元象 XVERSE 于 2021 年初在深圳成立,是国内领先的 AI 与 3D 技术服务公司,致力于打造 AI 驱动的 3D 内容生产与消费一站式平台,愿景为“定义你的世界”。

元象创始人姚星是前腾讯副总裁和腾讯 AI Lab 创始人、国家科技部新一代人工智能战略咨询委员会成员。元象累计融资金额超过 2 亿美元,投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。

元象获国家“专精特新”、“高新技术企业”认证,团队目前有75%为研发人员(60%为硕博学历)。公司积极推动前沿技术自主研发,在3D领域,自研行业引领性的“端云协同” 3D 互动技术,开创零门槛(轻)、一站式(快)、高品质(美)全新 3D 体验;在AI领域,公司最早开源国内最大参数大模型(650亿)、世界最长上下文长度(256K)在内的一系列高性能大模型,免费可商用,将国产开源提升至国际一流水平,积极推动大模型国产可替代和行业应用发展。

元象已经为多家龙头企业提供一站式技术与服务,包括:澳门大三巴、南京大报恩寺、央视、腾讯音乐TMELAND、华为、一汽大众、阿迪达斯、中国平安、中科院深圳先进院等。

公司注册名:深圳元象信息科技有限公司

官网:www.XVERSE.cn

官微:元象 XVERSE

Logo下载

链接:https://pan.baidu.com/s/1fB-zoITVJZ7Znv5IVe-fZg

提取码:rav0

雷峰网

相关内容

热门资讯

原创 王... 王菲与流浪猫的故事,藏着娱乐圈最温暖的秘密。这位一直低调的天后,花了十年的时间,把北京的豪宅改造成了...
新春消费新体验!厦门通过AI赋... 厦门中山路“两岸数智非遗年”现场,游客戴上暴龙智能AI眼镜,眼前就像换了一个世界:拍照识物、百科问答...
【2026新春走基层】初二“回... 2026 新春走基层 今天,是农历丙午马年的第二天,在传统习俗中被称为“回门日”。记者来到佳惠超市,...
原创 向... 最近,美国政坛又上演了一场激烈的对决,主角依旧是那对老冤家:加州州长加文·纽森和前总统唐纳德·特朗普...
阿达尼计划投资千亿美元建数据中... 来源:环球市场播报 阿达尼集团计划至2035年投资1000亿美元,开发由绿色能源驱动的人工智能数据中...
原创 俄... 近期有消息称,俄罗斯正在与美国进行私下接触,计划在乌克兰危机解决后重返美元结算体系。这个消息令人意外...
中国上市公司协会:2025中国... 今天分享的是:中国上市公司协会:2025中国上市公司ESG行业报告 报告共计:144页 2025中国...
险资新动向:入局创投基金 2026年2月7日,国创中金(北京)运营管理有限公司正式成立,注册资本5亿元,标志着保险资金进一步入...
浮盈已超千万!“花生油大王”家... 虽然鲁花集团尚未登陆资本市场,但孙孟全家族近来在A股市场颇为活跃。 “鲁花5s压榨花生油,为您报时!...
原创 美... 最近几年,美国黄金储备的真实情况又成了焦点。外界总在猜,诺克斯堡金库里那4580吨黄金到底还在不在。...
美股盘前走低,科技股普跌!金银... 2月17日,美股盘前,美股三大股指期货全线下跌。 科技股盘前普跌,截至发稿,AMD、美光科技、谷歌、...
原创 美... 特朗普刚刚宣布对中国电池级石墨征收最高达160%的双反关税,紧接着便声称中美关系非常好,并重申了他4...
【锋行链盟】港股上市公司控股股... 港股上市公司控股股东设立股权信托是一项复杂的法律与金融操作,需兼顾合规性、控制权稳定性及商业目标。以...
亿汇:全球外汇市场的智能量化交... **摘要** Moneta Markets亿汇作为全球外汇市场的前沿参与者,依托智能量化技术,为用户...
美国关税重创墨西哥汽车业,中国... 继加拿大表达更积极的欢迎态度之后,墨西哥——这个目前仍由左翼总统执政的北美国家也对中国汽车企业在当地...
原创 普... 大家好,我是小川。2026年年初,全球金融圈因一份匿名流出的俄罗斯内部备忘录而陷入了巨大的震荡。曾经...
原创 欧... 俄罗斯打算全面进攻欧盟及北约国家?这个问题的答案其实早在去年普京就给出了:不会!甚至他准备将这一承诺...
新股前瞻|维达力科技赴港的背后... 来源:智通财经网 2026年初,一家长期隐身于全球科技巨头供应链背后的“隐形冠军”——维达力科技股份...
每卖出3套房就有1套是外地人购... 统计数据显示, 2025年以来省外人士 在云南购买商品住房2.9万多套, 占全省购房套数的31.7%...
美联储官员激辩降息重启剧本,通... 美联储多位官员周二密集发声,古尔斯比提及年内多次降息的可能性,戴利强调需持续降通胀,巴尔则预计还要按...