何中市:机器学习新媒体内容服务模型与方法
7月22日上午,重庆大学何中市教授为2021“网络与新媒体讲习班”全体学员做了题为“机器学习新媒体内容服务模型与方法”的专题讲座。何中市教授是中国计算机学会人工智能与模式识别专业委员会委员、重庆市认知科学学会副理事长,重庆市学术技术带头人、重庆大学语言认知与智能计算二级学科博士点创建学术带头人。讲座由重庆大学新闻学院曾润喜教授主持。
何中市教授在讲座中
何中市教授从新媒体内容服务谈起,认为新媒体是数字技术、网络、数字终端、用户的结合体,是信息和服务的结合体,具有个性化突出、受众选择性多元、表现形式多样、信息发布实时等特点。新媒体的个性化内容服务主要通过内容检测、热点追踪、信息检索、情感评价、信息抽取、创作编辑等计算机处理方法来实现。
在何中市教授看来,自然语言处理是研究计算机如何对语言文本进行处理和加工的一种方法,研究内容包括对词法、句法、语义和语用等信息的识别、分类、提取、转换和生成。自然语言处理表现形式主要为机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音识别等。
何中市教授向学员们介绍了自然语言处理的三个发展阶段,随着语料库不断丰富,研究人员愈发重视深度学习与自然语言处理的结合,研究方法也逐渐从理性主义向经验主义转变。同时,何中市教授也指出,自然语言处理在未知语言现象、歧义词汇、隐喻表达等方面还面临技术挑战,需要进一步探索突破。
何中市教授讲座现场
何中市教授为学员们介绍了机器学习的基本模型方法。他谈到,算法通过对大规模语料库和语料知识库的统计,能够得出语言使用的普遍规律,并在此基础上,应用n元语言模型、隐马尔可夫模型、决策树分类、回归预测、神经网络等数学模型,实现语言知识的自动获取,从而对未知语言现象进行有效推测。为了便于学员们理解算法模型,何中市教授在现场用五本大小不同的书,模拟汉诺塔游戏,生动地阐释了算法的分治和递归思想。何中市教授还以高德地图的最短路径为例解释了算法是如何进行动态规划的。
何中市教授认为,机器学习是人工智能的核心,涉及概率论、统计学、算法复杂度等多门学科,研究人员要培养学科交叉思维。比如,机器学习应用于网络新媒体领域,实现了数据结构化、语言结构化和图像结构化,让图、文、音、视等媒体内容得到极大丰富,促进了国内融媒体研究与实践的发展。同时,何中市教授强调,学科交叉并不意味着迷失与游走,要在坚守本学科、纵向深化研究功底的基础上,提高思想维度,横向拓宽研究兴趣。在讲座尾声,何中市教授用“图文声兼融媒体,社自新传承网络”的诗句总结了这次来到网络与新媒体讲习班的感悟。
学员现场提问
何中市教授答疑中
在交流互动环节中,何中市教授针对讲习班学员们提出的“如何有效规避文本隐喻对最终研究结果产生的影响”“如何对短视频进行视听语言分析”“自媒体工作者如何获得算法的红利”等问题进行了解答。
曾润喜教授总结
曾润喜教授对何中市教授的讲座进行了总结,他谈到,新闻传播学很多研究方向越来越走向与计算机等学科的交叉融合,新时代的新闻传播学子应当能够提出技术需求、了解技术原理、理解技术过程、协助技术开发以及反馈技术效果,成为面向未来社会发展的创新型人才。
文/康凤娇 图/徐双双