校园版ChatGPT来啦!香港中文大学(深圳)凤凰大语言模型即将上线
深圳特区报首席记者 焦子宇
2023-08-14 09:17

“我的英文写得不好,可以帮我把这篇论文润色一下吗?”“堆排序的时间复杂度是多少?”“假如你是徐志摩,写一首关于‘微积分’的浪漫现代诗。”“我有点不开心,能陪我聊聊吗?”“帮我讲一个关于微积分的笑话。”“向我的商科同学,用大白话解释一下什么是香农定理。”……面对高校师生的众多学术问题,如何发挥类ChatGPT在高校学术方面答疑解惑的专项优势?近日,香港中文大学(深圳)师生团队联合深圳市大数据研究院自主研发了一款名为“凤凰”的大语言模型并即将上线。

“凤凰”大语言模型结合了全球领先的人工智能技术与校园教学、研究需求,是一款经过校内数据科学团队精心研发的一项人工智能应用,旨在针对校内数据进行指令微调,为广大师生提供智能化、高效率的学习与研究支持。

“凤凰”的灵感来源

2023年5月,香港中文大学(深圳)的师生团队聚在一起开展课题小组讨论时,大家充满激情地构想着一个令人兴奋的场景:“我们可以开发一款专门用于校内的大语言模型,为校内师生提供个性化的智能学习和研究辅助,让学术探索更加高效和智能化!”

一切创新都源自生活,凤凰大语言模型的构想也是如此。数据科学学院的青年教师王本友教授对于学生的学习与科研需求一直心怀关切。在日常交流中,他经常听到团队里的学生讲述在处理海量学术数据和文献时遇到的困难。深知学生们在技术和理论上的压力,王本友教授决定以他的学术经验,带领这三位出色的学生共同探索一个解决方案,希望做出一款专属于校内师生的大语言模型,真正将人工智能与校园生活无缝地结合起来。

王本友教授介绍,“我们要把大模型语言做到专业且简单易用,未来我们将会打造专属于团队的大语言模型生态。从解决问题出发,不一定要高大上,能解决问题的方法就是好方法。这是一个非常有前景的项目,如果我们能开发出一款智能化的大语言模型,能够根据学生的需求进行个性化辅助,定制化输出结果,将会给学校师生带来极大的助力!”王本友教授在获得成熟的构思之后,立刻与博士生陈志鸿同学进行了可行性的沟通,并与计算机科学与技术专业的本科生研究助理刘禹恒同学取得联系,指导刘禹恒同学主导研究“凤凰”项目。随后,团队招募了三位研究助理加入团队,他们分别是来自大数据科学专业的本科生欧阳恺瑞同学、张一笛同学和来自大数据研究院的研究助理宋定杰。他们融合各自的专业知识和热情,通宵达旦地研究、探索和迭代。

经过数月的不懈努力,“凤凰”大语言模型拟在8月中旬发布内测版。大模型发展到现在,研究从模型和算法转到了以数据为中心(Data-centric), Data-centric是一个新概念,研发团队秉持以数据为中心的计算方式,完成了数据工程,指令微调反馈学习和检索增强等一系列关键步骤。

香港中文大学(深圳)研发团队除了开发了“凤凰”,还同时开发了专注于医疗健康领域的大模型“华佗GPT”。其中公开资料显示,2023年2月,研发团队发布的“华佗GPT”是首个国内类ChatGPT的医疗大模型,也是国内公开的首个通过多个医疗资格考试的大模型,目前线上已经有十几万用户体验了“华佗GPT”的功能。

“凤凰”丰富的应用场景

以前,为了获取校内各领域的资讯,师生可能需要在数十个校内公众号间来回切换获取信息。如今,有了“凤凰”大模型,只需轻松提出问题,“凤凰”将为你深入研究,呈现准确的信息,为你的学术和生活提供便捷的指引。

“凤凰”不仅仅是一款应用,更是智慧校园导航。想知道学校有几个食堂?哪些菜品好吃实惠?想要了解某个学院的师资力量、讲座讯息?别担心,向“凤凰”提问,它会为你一一解答,让你快速了解校园的方方面面。“凤凰”在具有香港中文大学(深圳)校内知识的同时,在通用能力方面也达到了GPT的95%的水平,具有强大的智慧内核。通过此技术,团队希望模型的输出更加贴近校园现实,为校内师生提供真正有用的智能化建议与支持。在使用期间,“凤凰”研发团队深知数据安全与隐私保护的重要性。所有“凤凰”大语言模型的应用都遵循严格的数据隐私保护原则,确保师生的个人信息与学术数据。

在香港中文大学(深圳)的师生努力下,国产大语言模型将会融到学校教学科研的方方面面,孕育出更多智慧的火花,未来的发展令人期待。“凤凰”大语言模型,不仅是校园中的学习助手,更是一位全面的知识伙伴。在“凤凰”背后,是无数研究人员的辛勤付出和创新思维的结晶。“凤凰”团队在探索自然语言处理领域取得了重大突破,通过深度学习技术,实现了对大规模数据的全面分析与理解,未来将为学校师生提供强大的学术助力。

“凤凰”大语言模型是香港中文大学(深圳)在人工智能领域迈出的重要一步,“凤凰”研发团队将在未来不断精进技术,为校园带来更多创新与可能,帮助每一位师生在知识的海洋中展翅高飞,携手并进,走进未来,共享智慧。

第三方中文大模型排行榜,凤凰大模型排名第五名。

“凤凰”大语言模型学生团队,从左至右依次为:陈志鸿 (2019级博士生 思廷书院 理工学院)、刘禹恒 (2020级本科生 思廷书院 数据科学学院,高中毕业于成都七中嘉祥外国语学校)、欧阳恺瑞 (2021级本科生 逸夫书院 数据科学学院,高中毕业于广东实验中学)、张一笛(2021级本科生 逸夫书院 数据科学学院,高中毕业于哈尔滨第三中学)。

医学资格考试的分数排名(https://cmedbenchmark.llmzoo.com/),除GPT4,华佗-II遥遥领先其他模型。

【图片由香港中文大学(深圳)提供】

(原标题《校园版ChatGPT  香港中文大学(深圳)凤凰大语言模型即将上线》)

编辑 王子烨 审读 吴剑林 二审 高原 三审 詹婉容

(作者:深圳特区报首席记者 焦子宇)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页