该方向结合区域经济与社会发展的要求,从自然语言、语音和图像三方面展开模式识别分析与智能化的研究,主要研究内容有:文本挖掘、知识图谱、语音合成和医学图像处理。
文本挖掘指的是从文本数据中获取有价值的信息和知识。文本挖掘是一个多学科混杂的领域,涵盖了多种技术。该方面主要研究命名实体识别、关系抽取、自动问答,并着力于文本挖掘技术在智能海关、智能医疗领域的应用。
知识图谱旨在用来描述真实世界中存在的各种实体和概念,以及它们之间的关系。知识图谱技术是人工智能技术的重要组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。该方面主要研究知识图谱中的知识抽取、知识表示、知识融合以及知识图谱在医药等行业中的应用。
语音合成是一种可以将任意输入文本转换成相应语音的技术,是人机语音交互中不可或缺的模块之一。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是让机器像人一样开口说话。该方面主要专注于高自然度、有感情色彩,个性化的语音合成研究。
医学图像处理指利用计算机图像处理技术对各种不同成像机理的医学影像进行分析和处理,获取图像的内在规律,辅助医生对病变体及其它感兴趣的区域进行定性甚至定量的分析,进而提高医疗诊断的准确性和可靠性。该方面研究主要集中在病变检测、图像分割等。