AI系统包括算法模型和工程架构两大部分,近年来深度学习的火热让大家把算法模型和AI几乎划上了等号,然而我们也不可忽略工程架构的作用,两者紧密结合才能构建一套完整的AI系统。在构建AI系统时如何设计一套稳定灵活的工程架构以支持算法模型的高效迭代是一项技术挑战,我们将举办一期AI工程架构系列沙龙,分享58同城AI Lab在智能客服、“灵犀”智能语音分析平台、语音识别引擎、向量检索平台中的工程架构实战经验。01# 智能客服商家版后端架构设计
02# 语音识别引擎后端架构设计
03# “灵犀”智能语音分析平台后端架构设计
04# 如何打造高性能向量检索平台
主办:58同城AI Lab、58技术委员会AI分会、AICUG
出品:58同城 AI Lab 负责人,58技术委员会AI分会主席 詹坤林
2020年12月8日,由58技术委员会AI分会和AICUG技术社区联合举办的《58同城AI工程架构系列沙龙》直播圆满完成,直播平均吸引了约500人观看。后续我们会持续推出更多方向主题的直播沙龙活动,敬请持续关注。
本次沙龙的干货如下,各位技术大拿们敬请享用。
58同城智能客服系统'帮帮'诞生于2017年,被广泛应用于58各前台业务线的客服人员和用户沟通场景,折合节省客服人力约500人,大大提高了客服人效。2019年,我们将智能客服应用于58同城C端用户和B端商家沟通场景,打造了智能客服商家版平台——'帮帮商家版',助力B端商家提高获客效率和增加收益。本次议题将首先介绍'帮帮商家版'微服务架构,然后介绍数据存储、对话管理、可插拔式QABot、TaskBot的设计,最后介绍帮帮商家版在黄页微聊代运营场景中的应用实践和效果数据。58同城AI Lab后端资深工程师。2017年10月加入58,目前主要负责智能客服商家版后端开发工作,曾先后从事过推荐系统、智能客服后端研发,2012年硕士毕业于中国石油大学(北京),曾就职于朗讯科技。关注“58AILab”公众号—部门介绍—联系我们—添加小秘书微信(WubaAILab)备注 “AI工程架构” 即可获取。语音是58同城生活服务平台上用户之间的重要沟通媒介,C端和B端用户之间可以通过电话、音视频通话建立连接,58同城销售客服人员会通过呼叫中心与客户进行电话沟通,每年会产生数百万小时的通话录音,这些语音数据具备巨大的挖掘价值,我们自主研发了58生活服务领域的语音识别引擎,效果优于同类型语音厂商和业界通用语音识别厂商。本次议题将讲述我们如何从0到1构建语音识别后端服务,首先介绍系统总体架构,然后介绍语音文件转写服务,包括语音文件解析、语音解码和docker服务部署,再介绍实时语音识别服务,包括音频字节流的交互和实时解码过程,最后总结开发过程中遇到的问题及优化实践经验。58同城AI Lab后端架构师。2017年2月加入58,目前主要负责语音识别引擎后端架构设计和开发工作,曾先后负责过推荐系统、智能语音机器人系统的后端架构与开发工作,曾就职于汤森路透、H3C。关注“58AILab”公众号—部门介绍—联系我们—添加小秘书微信(WubaAILab)备注 “AI工程架构” 即可获取。语音是58同城生活服务平台上用户之间的重要沟通媒介,C端和B端用户之间可以通过电话、音视频通话建立连接,58同城销售客服人员会通过呼叫中心与客户进行电话沟通,这些场景下产生的海量语音数据具备巨大的挖掘价值,我们打造了'灵犀'智能语音分析平台,利用自研语音识别引擎将通话录音转换为文本,使用NLP技术挖掘文本语义标签,构建了语音质检、用户画像等AI应用。本次议题将首先介绍灵犀平台总体架构,然后介绍海量语音数据的下载/存储方案、语音转文本服务、语义标签挖掘/存储/检索流程,最后介绍Web可视化接入系统。58同城AI Lab后端资深工程师。2019年1月加入58,目前主要负责灵犀语音分析平台后端开发工作,2015年硕士毕业于中国科学院大学,曾在航天科技、创业公司从事后端研发。关注“58AILab”公众号—部门介绍—联系我们—添加小秘书微信(WubaAILab)备注 “AI工程架构” 即可获取。向量检索广泛应用于各类机器学习系统,如在推荐系统召回环节基于用户向量计算其最相似的K个物品向量,在问答系统中使用用户输入语句向量匹配最相似的问题,在图片检索系统中基于图片向量检索最相似的图片等。为了快速满足上层应用对向量检索的需求和提高研发效率,我们基于Faiss打造了一套向量检索平台。本次议题首先介绍平台总体架构,然后介绍增量索引、分布式索引和检索服务,并分享系统优化过程中遇到的问题及解决方法。58同城AI Lab后端高级工程师,2019年7月加入58,目前主要负责WPAI深度学习平台、向量检索平台的后端开发工作,2016年硕士毕业于中国科学院大学,曾就职于中科院信工所。