阿里达摩院联合高德发布多模态地理文本预训练模型MGeo，已在魔搭社区开放 | 速途网

速途网 • 2年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

速途网2月21日消息（报道：李楠）今日，达摩院联合高德发布业界首个多模态地理文本预训练模型MGeo，其可充分理解地图上的每一个元素，并精准完成地图搜索、地理位置分析等任务。MGeo是阿里通义模型系列旗下的新模型，目前已在魔搭社区开放（https://modelscope.cn/models/damo/mgeo_backbone_chinese_base/summary）。

地理文本信息处理是导航软件、物流以及零售等行业的基础。然而，目前传统地理文本AI算法对于地理信息的理解仍局限在经纬度以及经纬度的远近上，无法像人类一样理解地图上的元素，该方法难以精准表示景区、园区、商业街等大型地理实体的具体形状，以及不同地图元素之间复杂的临近、包含等关系。

针对上述问题，达摩院联合高德提出地理文本多模态模型，使用对抗MLM预训练、句子对预训练及多模态预训练三大技术，并用多任务预训练将这三种预训练任务进行动态组合，最终训练得到适合于多类地理文本任务的预训练底座MGeo。该模型拥有丰富的地理知识，能像人类一样跨模态理解地图与地理文本的信息，相关研究成果已被EMNLP、AAAI等国际顶级会议收录。

阿里达摩院联合高德发布多模态地理文本预训练模型MGeo，已在魔搭社区开放 | 速途网

MGeo像人类一样具备跨模态理解能力，可识别地图元素之间的位置关系

据悉，高德基于MGeo研发了全新的模型，不仅显著提高泛化语义的表示能力，还可准确识别不同地图元素之间的位置关系，有效提升用户的搜索体验。例如，当用户在杭州输入“星光荟对面中国美术”时，MGeo能根据位置关系准确定位到中国美术学院象山校区，而传统BERT模型则给出了错误定位结果；此外，在用户书写有误的情况下，该模型也能匹配正确的结果。该能力已逐步在高德灰度上线。