大模型一本正经“胡说八道”怎么破?IDEA研究院最新成果重磅亮相
读特融媒体记者 邱思艳 文/图
2023-11-22 22:31

读特客户端

读特在线,您的新闻观察眼

11月22日,2023 IDEA大会在深圳举行。IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋在会上发表主旨演讲,并发布IDEA研究院的重磅研产结晶与市场化成果。

视觉提示模型T-Rex

今年4月,IDEA研究院曾推出能够“一句话检测、分割一切”的Grounded SAM,通过文字提示实现精准的目标检测,极大降低了技术使用与落地门槛,在Github上火爆出圈。

此次,同个研究团队带来新作:视觉提示模型T-Rex。T-Rex是一个开箱即用的模型,无需重新训练或微调,即可检测模型在训练阶段从未见过的物体。产品研究团队表示,在真实应用场景中,许多罕见、复杂物体难以用文字充分描述,视觉提示的加入能够有效解决这一痛点。直观的视觉反馈与强交互性,也有助于提升检测的效率和精准度。

大会现场,沈向洋还发布了T-Rex的模型实验室(playground),Interactive Visual Prompt(iVP),用户可亲自试玩解锁“一图胜千言”的prompting新体验。

Think-on-Graph思维图谱技术

大模型虽好,但“一本正经的胡说八道”怎么解?大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性,这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷,是当下AI应用的重要课题。

为此,IDEA研究院团队研发了Think-on-Graph(思维图谱)技术,让大模型和知识图谱强强联合。总体来说,大模型更擅长意图理解和自主学习;而知识图谱因其结构化的知识存储方式,擅长逻辑链条推理,具有更佳的可解释性与可实时更新性。Think-on-Graph通过实现两者的紧耦合交互,驱动大模型agent在知识图谱上“思考”,逐步搜索推理出最优答案(在知识图谱的关联实体上一步一步搜索推理)。每一步推理中,大模型都亲自参与,与知识图谱相互取长补短。

两大语言类项目引人注目

除了在人工智能方向上一往无前,IDEA研究院还十分重视计算机科学领域中其他分支的创新,沈向洋在会上重点介绍了两个语言类项目。

今年8月,由IDEA研究院推出的MoonBit月兔在Hacker News(由Y Combinator创办的知名科创社区)登上头版头条。MoonBit 是由Wasm驱动,专为云计算与边缘计算设计的开发者平台,同时利用AI大模型赋能传统工具链,提升代码生成效率。IDEA研究院展示的另一门新语言,是区块链并行智能合约语言GCL,其旨在打造区块链系统上的最优解决方案。

成立三年带来一批优秀创业项目

近年来,技术创业已然成为许多技术创新者的下一站。成立刚满三年,IDEA研究院也带来一批已经或正在走向大市场的优秀创业项目。

这些项目中,既有主打AI for Scientists的AI科研产品ReadPaper,也有为数据要素可信流通提供硬件级安全保障的SPU机密计算协处理器、SPU-G异构AI协处理器,还有基于自研知识图谱与生物医学领域大模型的脑卒中智能防护产品StroCare。

除了让跨学科、跨界人才在IDEA的平台上碰撞出火花,IDEA也积极与产业伙伴合作,将技术应用到场景,深入到业务中去。

今年,万科IDEA联合实验室推出了自主研发的几何建模与约束引擎,填补在工业设计软件领域的国产空白。自2021年宣布成立以来,该实验室已在深圳、上海建设起一支集合图像学、几何计算、视觉技术、机器学习等领域顶尖人才的研究队伍。

此外,IDEA研究院还通过CTO Labs平台与一批独角兽企业和瞪羚企业联合创新,合作伙伴包括数说故事、晶泰科技、翼方健数等。本次IDEA大会上,IDEA视见睿来实验室发布了HiveNet可控人像视频生成平台,实现AI技术方案对传统视频拍摄流程(编、导、拍、演、剪)的全面替代。

见习编辑 孔盼成 审读 刘春生 二审 张玉洁 三审 王越胜

(作者:读特融媒体记者 邱思艳 文/图)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页