中新网包头2月23日电 题:人大代表闫宏伟:当稀土遇到DeepSeek
记者 李爱平
轻启笔记本电脑,倒上一杯热水,在内蒙古自治区包头稀土研究院,闫宏伟的一天这样开始了。
蛇年春节过后,他在日常工作中多了一个“朋友”——DeepSeek(深度求索)。过去20多天,他将其运用到“稀土通用语料库及其系统的设计和研发”(简称稀土语料库)项目中,颇有成就感。
“在研究中,若有不懂之处,请教DeepSeek,很快就能获得启发。”闫宏伟近日在接受中新网记者专访时表示,DeepSeek助力了研发项目,堪称自己的“左膀右臂”。
作为全国人大代表,闫宏伟是在2024年全国两会结束后开始拥抱人工智能的。彼时,他深感在稀土领域,融入人工智能,已是未来必然趋势。
“但那时DeepSeek还未横空出世,我只能通过购买各类专著,一点点学起。”在闫宏伟的办公室内,他学习过的《线性代数》《数据有道》等书籍上都留下了他标记的勾勾画画。
学习一段时间后,闫宏伟开始主动介入人工智能。他最先运用到的是ChatGPT。“运用ChatGPT的第一感觉是,这款人工智能模型不仅能答疑解惑,还节省研发时间,但尚有美中不足之处。”
闫宏伟认为,在人工智能的助力下构建稀土语料库项目,能填补包头稀土研究院在该项目上的空白。“在稀土行业内使用各类大语言模型、人工智能模型和机器学习模型进行训练,时不我待。”
“现在DeepSeek-R1的中文理解能力大幅度提高,推理能力更是达到了全球领先水平。”闫宏伟认为,必须对DeepSeek给予重新理解,找出更好的解决方案。
为此,他开始尝试引入DeepSeek-R1作为助手,解决没有资源、人手的困难。他力争在6月份前完成稀土语料库的研发。
“这个项目研发成功,也意味着一个标准稀土语料库宣告建设完成。”闫宏伟认为,这是自己这个人工智能领域“小白”努力至今做的最正确的事情。
稀土遇到DeepSeek,在闫宏伟的手中到底能碰撞出什么样的火花?他认为,开发稀土语料库,首要是为了训练和微调自己的机器学习模型与大语言模型,这个应用场景直观但是需要专注细节,通过不断增加语料库,可以为行业参与者提供持续的人工智能基础支持。
当下,闫宏伟在研发稀土语料库的过程中,还开发了稀土语料库管理系统。
“实际上这是一个语料库生产系统,利用它,可以不断地将行业和组织的私有文献加工成易于训练和微调的数据集,并且将原始资料和语料库视为某种广义标记数据集。”闫宏伟认为,此举对探索跨文本(含音视频等)资料语料化的技术路线和实现具有重大意义,也对他所从事的稀土行业有着重大意义。(完)