近年来,随着人工智能的不断进步,自然语言处理领域的大规模预训练模型(如GPT系列)也在不断发展,这些模型可以处理各种类型的自然语言文本,并且可以根据不同的任务进行微调。这些大模型的应用范围不断扩大,正在改变着人们的生活方式和工作方式。在当今社会,人们需要与各种类型的数据进行交互和沟通,而自然语言处理技术则可以帮助人们更好地理解和生成自然语言文本。无论是语音识别、机器翻译、智能客服、推荐系统还是情感分析等,自然语言处理技术都发挥着重要的作用。
2023年8月3日-6日,第二十二届中国计算语言学大会(CCL 2023)在黑龙江省哈尔滨市成功举行。本次会议由中国中文信息学会计算语言学专业委员会主办,哈尔滨工业大学承办。大会邀请到了中国科学院陆汝钤院士、西安电子科技大学焦李成教授、哈尔滨工业大学刘挺教授、中国科学院计算所陈熙霖研究员和字节跳动李航博士五位知名专家做大会特邀报告。 NLP前沿动态综述论坛邀请到了十位专家,分别是浦江实验室青年科学家颜航博士、清华大学刘知远副教授、中国人民大学严睿副教授、南京大学黄书剑副教授、南京航空航天大学李丕绩教授、中科院计算所范意兴副研究员、中科院自动化所陈玉博副研究员、天津大学熊德意教授、哈尔滨工业大学张伟男教授、微软亚洲研究院段楠研究员。讲习班邀请到了四名讲者,包括中科院自动化所陈玉博副研究员、复旦大学桂韬副研究员、清华大学张超助理教授、清华大学赵昊助理教授。
会议讲习班围绕预训练语言模型中的知识分析、萃取与增强,大模型安全伦理,利用语音语言处理模型研究大脑的语言认知机制,基础模型用于机器人领域的最佳学术实践等主题作了系统深入的讲解。在前沿动态综述报告会中,围绕大模型在训练、高效微调、人机对话、机器翻译、文本生成、信息检索、知识图谱、价值对齐、模型评价以及多模态等相关方向前沿动态进行介绍并与现场学者展开了热烈的讨论。在特邀报告中进行了分别作题为《大数据·大知识·大智能》、《认知安全》、《关于ChatGPT引发的几点思考》、《理解非语言交流——通往无缝人机衔接》以及《开启AI大模型的时代新征程》的特邀报告,介绍了所在团队研究进展并分析了国内外人工智能大模型的当前态势和未来发展的机遇和挑战。
中国科学院数学与系统科学研究院陆汝钤院士做题为《大数据·大知识·大智能》的报告,本报告首先回顾了大数据概念及其研究的问世,指出在大数据进入人们视野的同时,大知识的概念以及从大数据中提炼大知识的呼声也开始响起。报告通过一组实例介绍了报告人关于大知识的研究,包括对大知识和大知识系统的刻画,大知识在现代社会中的体现及其迅速发展。同时介绍了报告人团队在这方面做的一些工作。报告的下半部分遵循学术界普遍认可的“数据-信息-知识-智能”流程进一步提出了大智能的问题。并将通过实例给出自己对大智能的定义及其种种表现形式。同时介绍有关专家的观点及我们的分析。特别是讨论了如何从大数据和大知识涌现大智能。最后讨论了这三者的表示研究和工程建模问题。
哈尔滨工业大学刘挺教授做题为《认知安全》的报告,报告主要介绍了在互联网时代,公众对世界的认知强烈地受到网络媒体的影响,网络媒体上的信息鱼龙混杂、真伪难辨。计算机根据包含着不同价值观的数据训练出来的大模型,自动生成和发布各种类型的媒体数据,这进一步加重了对认知安全的威胁。围绕“认知安全”这一主题,从需求、数据、技术、应用等各个层面进行探讨,并介绍其所在团队在该领域已经取得的工作进展。我院计算机科学与技术专业研究生韩蓉、张浩宇、刘昊宸、孙云杰同学参加了本次会议,聆听了各位专家的报告、演讲,同时与专家、同行进行了深入的交流。
经过这次会议学习,使我院师生在自然语言处理、人工智能等方面的认识得到了提升,深入学习了自然语言处理技术的最新进展和应用,为我院日后在自然语言处理领域、大模型及应用等方面的研究进一步发展打下了坚实的基础。