教育部:到2027年初步建成国家关键语料库
中新网北京3月31日电(记者 袁秀月)31日,记者从教育部新闻发布会上获悉,教育部、国家语委、中央网信办近日共同印发《关于加强数字中文建设 推进语言文字信息化发展的意见》(以下简称《意见》)。《意见》提出,到2027年,基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库。
新闻发布会现场。袁秀月 摄 到2027年初步建成国家关键语料库
《意见》提出,到2027年,国家数字中文建设行动取得重要成效,语言文字数据要素价值有效释放。基本形成“政府主导、部门协同、社会参与、共建共享”的语言文字信息化工作机制;基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库;语言文字信息化标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。
到2035年,中文在全球数字空间、网络空间以及生成式人工智能等关键应用场景中的使用占比显著提高;语言文字信息化有力支撑国家语言能力建设、语言文字事业和经济社会高质量发展,整体水平位居世界前列。
推进大语言模型等基础术语规范化
在完善规范标准方面,《意见》提出,以语言文字信息处理标准建设为基础,支持面向信息技术及人工智能领域的语言资源建设、管理、应用、共享标准研究,重点推进语料库、数据标注、数据评价等规范标准的制修订。推进大语言模型等基础术语规范化。制定手语和盲文的信息化标准。研制民族语言文字信息化标准。研制甲骨文数字化共享技术标准。
在健全资源服务方面,《意见》提出,加快建设国家语言文字大数据中心,以数字化技术动态监测、收集和分析语言文字事业发展、国家语言能力建设、重点规划实施、重大工程进展等核心业务数据,提高数据支持决策效率。以国家语言资源服务平台建设为基础,带动地方语言资源平台建设。推动基础性语言资源建设,实施国家关键语料库共建共享计划,重点支持建设大规模中文语料库及高质量民族语言文字语料库、手语盲文语料库、行业领域语料库、语言监测动态语料库等。
重点加强语言文字资源信息安全治理
在人才培养方面,《意见》提出,依托国家语言文字关键研究领域领航计划,培养精通语言文字信息化建设的高层次紧缺急需人才。加强语言人才供需机制研究,支持高等学校语言学科与多学科深度交叉融合发展,加强“语言+人工智能”复合型人才培养。
在安全保障方面,《意见》提出,重点加强语言文字资源信息安全治理,切实加强数据安全、伦理道德、价值观对齐等重点事项的监测与管理,提升资源和技术的可信性、可控性和可靠性。支持生成式人工智能的语料规范性、生成内容评测评价和全流程追溯机制研究。加强面向语言资源监测的自然语言处理技术研究,强化语言文字信息安全的态势感知、监测预警、风险评估和应急处置。规范网络空间、数字空间的语言生态,建设健康文明的网络语言环境,守住网络安全底线。
打造中国版人工智能教育大模型
此外,《意见》提出,要实施数字中文服务教育发展行动、数字中文助力科技创新行动、数字中文赋能文化传承行动、数字中文推动产业升级行动、数字中文促进社会进步行动。
其中提到,服务国家教育数字化战略行动,加强语言文字信息化建设成果在国家智慧教育公共服务平台和地方智慧教育平台上推广共享;助力打造中国版人工智能教育大模型;研究基于大语言模型的教学新范式,研制大语言模型能力素养框架(师生版)。
《意见》还指出,加快布局支持一批新型语言文字交叉领域科研机构,重点建设多语言智能化科技创新中心和实验室。加强古籍数字化整理关键技术研究。推进甲骨文数字化共享。支持研发面向语言障碍人群、老年群体的科技设备,鼓励智能终端设备的适老化研发及无障碍改造。(完)
- 青年博士的科研路:在深耕中凝练方向 在思辨中突破桎梏
- 第二十七届海峡两岸经贸交易会将在福州举办
- 作风建设重在化风成俗(深入学习贯彻习近平新时代中国特色社会主义思想)
- 有人因此“毁容”!遇到这种虫子千万不能拍
- 从“硒”出发 专家学者聚首河南济源共探硒产业新发展机遇
- 促排卵会造成卵巢早衰?一次取几个卵泡合适?听专家科普
- 今年前4个月两岸进出口贸易额同比增长14.7%
- 习言道|新时代的中俄关系更加从容自信、稳定坚韧
- 孩子长大哮喘自然就好了?别信!医生提醒→
- 中国科学院团委举办青年先进典型宣讲活动
- 习近平指出,中俄双方要坚持合作大方向,排除外部干扰,让合作“稳”的基础更坚实、“进”的动能更充足
- “数理+AI+工程”打造未来卓越工程师 上海交大推出首届“笛卡尔班”
-
“把脉会诊”助力智慧田管 “数智”良方夺高产 农业焕发新活力
2015.12.16 -
运动是加速衰老,还是延缓衰老?真相揭开
2015.12.16 -
钙含量是牛奶近8倍的“补钙王者” 吃它这一点要注意
2015.12.16 -
新华图讯丨习近平出席俄罗斯纪念苏联伟大卫国战争胜利80周年庆典
2015.12.16