厌的成语>蒸鸡蛋热量
专利名称:基于细粒度图像特征和外部知识相融合的视觉问答方法
专利类型:发明专利
发明人:宋凌云,李建鳌,尚学群,俞梦真,彭杨柳,李伟,李战怀
申请号:CN202010883275.X
申请日:20200828
公开号:CN112100346A
军事地理
公开日:
历历可数的意思
丰华唱片
教师个人师德小结20201218
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于细粒度图像特征和外部知识相融合的视觉问答方法,该方法由四个步骤构成:细粒度图像特征提取、文本处理与特征提取、基于外部知识库的问题知识检索和多模态特征融合及答案预测。细粒度图像特征提取用于提取图像的分区域视觉特征;文本处理与特征提取对视觉问题问句进行处理并得到问句的整体特征;基于外部知识库的问题知识检索通过引入Freeba知识图谱作为模型的外部知识库为视觉问题答案的预测补充必需的常识或特定的知识;多模态特征融合及答案预测中利用基于相似度特征融合方法进行多模态特征融合,并利用融合后的视觉问题特征对问题答案进行预测。本方法具有较好的性能,对视觉问题的答案具有较高的预测准确率。
申请人:西北工业大学
地址:710072 陕西省西安市友谊西路127号
煮汤圆几分钟国籍:CN
撤诉
代理机构:西北工业大学专利中心
代理人:金凤
更多信息请下载全文后查看