【AI 领 SHOW】精彩回顾 ·更接近人类理解和思考方式的「紫东. 太初」
2022 年 9 月 1 日,世界人工智能大会(WAIC)「AI 领 SHOW」栏目在上海世博会议中心火热拉开序幕。「AI 领 SHOW」是本届 WAIC 整场会议活动全新升级后的配套栏目,「镇馆之宝」、「SAIL 奖 Top30 代表」、「重磅新品发布」、「元宇宙」等代表纷纷闪亮登场,全程通过大会官网及 CCTV.com 直播。
中科院自动化所研究员、武汉人工智能研究院院长王金桥首先在 AI 领 SHOW 栏目登台演讲,展示了基于昇腾 AI 基础软硬件平台打造的全球首个三模态大模型「紫东. 太初」。「紫东. 太初」通过跨模态多任务自监督学习,实现了图像、文字、语音和视频等不同模态数据之间的统一表示和互相生成的,且形成了完整的智能表示、推理和生成能力。
王院长在 AI 领 SHOW 栏目向与会嘉宾讲述道:「传统人工智能学习当中,通过视觉模型可以实现人脸的识别,但是并不知道机器怎么表征每个人的特征差异,只能从图像中间结果的特征图解释机器学习的过程,而通过「紫东. 太初」三模态的模型,可以把图像、语音等实现跨模态的统一到人类语言的维度,更接近于人类的理解和思考方式。」
细数「紫东. 太初」四大大突破
1. 多任务多层次的跨模态自监督学习
提出了多任务多层次的跨模态自监督学习的训练框架,支持词条级别、模态级别和样本级别的训练,实现了跨模态理解与生成的统一建模。
2. 首次使「以图生音」和「以音生图」成为现实
「紫东. 太初」首次贯通了语音、图像、文字这几种信息,形成了完整的智能表示、推理和生成能力,是当前数据智能领域的最新发展趋势,为探索人类智能本质提供了一个极佳的平台。
3. 首个千亿参数多模态预训练大模型
「紫东. 太初」作为全球范围内首个千亿参数的三模态大模型,标志着我国从限定领域的弱人工智能正式迈向通用人工智能路径的重要探索。
4.「一专一能」突破至「多专多能」
「紫东. 太初」多项算法指标性能全球第一。让 AI 从「一专一能」迈向「多专多能」的同时,在多项下游任务中超越业界最好的性能,构建了全自主人工智能技术体系。
除了向线上线下参会嘉宾展示「紫东. 太初」的技术优势,王院长还表示已经实现基础模型开源和大模型的服务开放,近期将开放「紫东. 太初」服务平台新的版本,支持低代码人工智能模型的训练、微调和部署,通过 API 调用的模式,自动上传数据,自动标注模型,自动形成推理部署的工具,自动体验效果。欢迎业内人士下载和体验:https://gitee.com/mindspore/omni-perception-pretrainer
0
分享
好文章,需要你的鼓励

参与评论
请您注册或者登录汽车之心社区账号即可发表回复
去登录
相关评论(共0条)
查看更多评论