出行洞察智能座舱中的情绪识别
本期报告将为您解答
市场分析
技术迭代
创业公司处理
车载应用案例
行业总结
机器识别人类情绪这一概念在90年代被提出后,相关研究一直层出不穷。随着各行业对人工智能与大数据技术的追逐热捧,AI情绪识别算法又重新出现在资本的视野中。随着国内情绪识别技术的发展,多模态融合的发展路径已成为行业的普遍认同,通过对感知端对人体数据进行收集并融合,使AI能够“感知”人体体征并通过算法进行“情绪理解”。对于专注于情绪识别技术的企业来说,量产落地的关键因素不光是多模算法模型的完善,也取决于干预手段、误判措施以及功能联动来帮助客户补全产品的服务闭环,从而也能撕下“伪需求”的标签。
01
市场分析
//市场背景
发展历史
年美国麻省理工学院媒体实验室的RosalindW.Picard教授首先提出,通过识别人体的情感信号,来创建一种能够感知、识别和理解人的情感,并且能够做出智能、灵敏和友好反应的计算机系统。在Picard教授专著的《AffectiveComputing》中指出,“情感计算是针对人类的外在表现,能够进行测量和分析,并能对情感施加影响的计算”,开辟了计算机科学的新领域。情感计算由此发端。
市场增长
根据MendorIntelligence的预测,年情绪检测与识别(EDR)市场价值为.9亿美元,到年,全球情感计算市场预计将增长到亿美元以上,预计到年将达到.8亿美元,预测期内(-年)年均复合增长率为18.01%。
市场潜力
按照市场价值,情绪识别的市场规模以应用场景来估算预计将超过千亿,其中安防、车载、医疗市场赶超百亿量级。
安防(占比22%):在公安审讯领域,根据公安部数据,截至年底,我国共有个派出所,全国共约有15万个审讯室。以每3个审讯室配备一套多模态情绪分析系统来估算,公安审讯的市场规模约为亿元。
汽车行业(占比31%):奥迪、宝马、奔驰、沃尔沃、丰田等车厂以及高通等通信公司都在研发该类技术。其中,奥迪的无线充电技术方案主要针对传输过程中效率流失的问题;宝马与奔驰合作研发的无线充电技术已经应用到了宝马i8车系上;沃尔沃也已经完成了电动汽车车载无线充电系统测试。
心理健康(占比33%):包括与可穿戴设备和教育中使用的心理健康诊断以及自主心理健康咨询服务。
//驱动因素
需求终端的共同诉求推动市场发展
消费端:数据表示目前市面上大多数智能产品都无法达到用户对“智能”的预期。对于C端客户来说,他们需要更个性化、针对化、客制化的产品与技术来实时与之交互。
政企端:以交通行业为例,在数字化背景下,对于用户数据的采集应用以及对于行驶安全监管的需求正在增长。公安部交管局统计数据显示,因“路怒症”引发的道路交通事故起数呈逐年上升趋势,年共导致事故8.02万起,上升4.9%,年又上升2.4%,年1-4月份再上升3.7%。中国司机心理障碍的发生率较高,达到59.8%。其中,长途汽车司机心理障碍发生率高达80%,私家车主则为44.4%。“问题司机”的各类心理症状主要包括“偏执状态”“强迫观念”“躯干化障碍”“人际关系敏感”等等。
细分领域按照功能需求分类
车载细分领域市场驱动
底层硬件前装量的爆发:DMS市场已进入增长阶段,对多模态情感识别算法在车上搭载利好。
DMS一般分为主动式DMS和被动式DMS。主动式DMS系统基于摄像头和近红外技术对眼睑闭合、眨眼、凝视方向、打哈欠和头部运动、心率、体表温度等人体行为与生物特征进行检测。根据高工智能汽车研究院监测数据显示,年1-9月国内自主及合资品牌前装搭载视觉DMS系统上险量为6.42万辆,和年同期相比,年1-9月前装搭载视觉DMS系统上险量同比增长超过%。前装标配搭载视觉DMS车型19款。DMS的增长也为情绪识别算法上车提供了硬件技术与数据来源。
技术驱动判断:高技术驱动行业
核心技术对情绪识别产品的影响:大
排除技术层面上情感计算的算法模型带来的side-product,整体模型的精准程度是衡量产品是否可靠的唯一标准,因此可判断底层的AI算法是情感识别产品的核心;但是,由此带来的问题是对于精准度的判断依据和核实方法的标准度和可靠性:即个体是否能精准“命名”自身的“情绪”。
同时,情感计算的发展受市场偏好与行业政策风向的影响已成为一个必然的技术趋势。然而有两大瓶颈也是在发展道路上不可避免需要解决:多模态的融合算法搭建与感知层的技术路径。
感知难点:取决于需要用于计算的信息来决定感知层的硬件难度。由于现在行业更加追求无感检测,最常见的如麦克风、摄像头,其他感知硬件如接触式感知设备则不被看好,因此如何在无感条件下实现多种信息的感知与获取成为一大难点。
多模融合难点:如上文所说,信息之间怎样关联,对模态之间的融合和权重配比是非常困难的。算法的情绪识别精确程度取决于数据信号的质量与融合算法上的突破。
//市场进入壁垒
情绪识别行业整体来说市场进入壁垒较高。模型的搭建优化、数据来源以及面对安防政企端的产品应用都意味着行业需要大量的前期投入与渠道铺设。
02
技术迭代
//技术迭代分析:从单模态的情绪识别逐渐衍生到多模态融合识别策略
在单模态情绪识别领域,单模态信息易受各种噪声的影响,难以完整地反映情绪状态。高效的模态融合能极大地提高情绪识别系统的健壮性。利用不同类别的信号相互支持,对互补信息进行融合处理,能够有效地提高最终的识别效果。根据目前已有的研究,模态融合的方式大致可分为4种,分别是数据级融合(传感层融合)、特征级融合、决策级融合、模型层融合。
数据级融合,又称传感器层融合。数据级融合是直接对各个传感器采集到的最原始的、没有经过特殊处理的数据进行组合,从而构造一组新的数据。
特征级融合是将多种模态数据经过提取、构建成相应的模态特征之后,再拼接成一个集成各个模态特征的特征集。
决策级融合是找出各个模态的可信度,再进行协调、联合决策。决策级融合与特征级融合相比,更容易进行,但关键是要探究各个模态对情绪识别的重要度。
模型级融合可以将不同模态特征分别输入到不同模型结构再进行进一步特征提取,目前的模型级融合主要采取的策略是通过构建深度网络模型,建立多层结构,逐层学习可以学习到更加复杂的变换,从而可以拟合更加复杂的特征,增加非线性表达能力。
03
初创公司
//国内情绪识别行业初创公司现状(以书面注明拥有情绪识别的功能产品判断)
主要数据来源以人脸和声音为主:采访了解到的12家公司中情感识别的算法是基于人的面部表情或行为进行识别(54%),其次是对语言内容的理解和分析(38%)。
应用场景以安防为主:目前主要的应用场景是在安防(54%)和智能客服(40%)两个方面落地最多。其中安防领域初创公司的以图像识别公司为主,智能客服领域以NLP公司为主。
国内情绪识别行业起步较晚集中在-年:晚于海外情绪识别算法约10年的时间,国内情绪识别算法公司多成立于年之后,也是由于年后我国人脸识别和NLP技术才开始在专业领域进行商业化落地如安防、楼宇、物管等。
//初创公司初步分析对比
国内初创公司:市场刚刚起步开始进行大规模的应用铺开,技术路径多为视觉分析
第一梯队代表:旷世、商汤、地平线、未动科技、竹间智能
多为以成熟的人脸识别或语言分析技术为起点在已确定的应用场景之上向情感分析领域拓展的科技公司为主
融资轮次集中在C轮以上,单轮融资金额过亿
在国内市场已有大规模应用与成熟的客户群体
大部分服务于安防、政企、交通行业
汽车方向,竹间智能有单独的汽车座舱情绪识别方案,商汤则侧重于自动驾驶图像分析,地平线与未动科技则侧重于提供DMS视觉算法解决方案
第二梯队代表:科思创动、阿尔法鹰眼、翼开科技、云思创动、想象科技
轮次集中在A轮左右,单轮融资金额在千万量级
大部分公司选择直接从情绪识别赛道入手再落地具体场景拓展:如想象科技选择在声纹识别情绪技术的基础上选择切入座舱健康与医疗心理健康场景
海外初创公司
5年开始,以AlchemyAPI为代表的情感识别算法公司开始大量涌现。
其中,AlchemyAPI(美国丹佛,5)以文本情感算法为主要方向在年被IBM收购
研究计算机图像情绪识别的Realeyes(英国,7)在年获得万美元的战略融资
主攻车舱场景的情绪识别Affectiva(美国,9)连续获得千万美元投资并在年获得自动驾驶算法公司Aptiv万美元B轮投资。
主要利用人工智能技术通过对面部表情的分析的Emotient(美国)在年被苹果收购
04
车载领域应用
目前,多模态情绪识别的研究主要集中于以下几个层面:基于多种外在行为表现模态、基于多种神经生理模态、基于神经生理状态和行为潜意识行为。
情书模态数据包括:行为模态(肢体动作、语言、表情、眼球)与生理模态(神经生理电、呼吸心率)
//车载应用案例
捷豹路虎
捷豹路虎研发的情绪探测及舒缓系统能够辨识人类面部表情的细微差别,并自动调节和优化车内环境,同时,系统对驾驶者的偏好进行深度学习,进而为用户提供更加个性化的环境设置。
技术路径:视觉识别生物识别
干预手段:环境变化
当系统探测到驾驶者的紧张情绪,环境照明将转变为镇静色,以舒缓压力;当系统探测到驾驶者的疲惫状态,车载媒体将播放驾驶者最喜欢的歌曲,以恢复精神;当系统探测到驾驶者的困倦迹象,如打哈欠,空调温度将随之降低,以保持清醒。(图片来源:捷豹路虎宣传片)
长城WEY
技术路径:摄像头视觉识别
干预手段:能够根据驾驶员进入车舱时做出的不同表情进行视觉识别,并播放相应情绪场景的歌曲或提示。
座舱搭载了第三代高通SA芯片,与车内虚拟助理、VIMS面部识别等功能进行联动
同时,OMS系统会针对后排乘客采用B柱上的毫米波雷达对生命体征进行检测。(图片来源:长安
转载请注明:http://www.abuoumao.com/hykh/1703.html