Cosero[1]是德国波恩大学的Sven Behnke团队根据家庭环境中的日常操作任务而研制的一款仿人操作欧宝体育客户端(如图1(a)(b))。欧宝体育客户端底部配备了四轮独立转向行走机构,以便在灵活的通过狭窄通道,上部配备了两个7自由度机械臂已完成拟人的操作,并在夹持器末端装有红外测距传感器已达到对抓取目标的距离探测,在顶端安装有Kinect相机,以实现对目标环境的3D感知。Cosero通过底盘的激光雷达进行导航和定位,采用法线估计和场景分割相结合的方法对目标进行3D点云分割,采用无碰撞抓取方法[1]对目标物体进行抓取(如图1(c)(d))。在论文[2]中,作者运用Cosero进行零件分拣搬运实验,通过2D激光雷达导航到作业点,通过RGB-D相机对目标进行识别分割,规划抓取路径和抓取姿态估计(如图1(e))。在论文[3]中,作者采用深度学习方法对目标进行姿态估计,并完成了提壶灌溉,人机交互和使用工具等复杂任务(如图1(f))。Schwarz[4]介绍了Cosero基于深度学习方法的目标姿态估计和RGB-D SLAM等感知测量。
欧宝体育客户端、无人机、自动驾驶汽车等加快落地,智慧城市深入建设,更是为传感器产业带来了难以估量的庞大机遇
中国移动联合产业合作伙伴发布《室内定位白皮书》,对室内定位产业发展现状及面临的挑战,深入分析了垂直行业的室内定位需求,并详细阐述了实现室内定位的技术原理, 及室内定位评测体系
下一个十年,智能人机交互、多模态融合、结合领域需求的 NLP 解决方案建设、知识图谱结合落地场景等将会有突破性变化
自然语言处理技术的应用和研究领域发生了许多有意义的标志性事件,技术进展方面主要体现在预训练语言模型、跨语言 NLP/无监督机器翻译、知识图谱发展 + 对话技术融合、智能人机交互、平台厂商整合AI产品线
NVIDIA解决方案架构师王闪闪讲解了BERT模型原理及其成就,NVIDIA开发的Megatron-BERT
基于内容图谱结构化特征与索引更新平台,在结构化方面打破传统的数仓建模方式,以知识化、业务化、服务化为视角进行数据平台化建设,来沉淀内容、行为、关系图谱,目前在优酷搜索、票票、大麦等场景开始进行应用
通过使用仿真和量化指标,使基准测试能够通用于许多操作领域,但又足够具体,能够提供系统的有关信息
优酷智能档突破“传统自适应码率算法”的局限,解决视频观看体验中高清和流畅的矛盾
姚霆指出,当前的多模态技术还是属于狭隘的单任务学习,整个训练和测试的过程都是在封闭和静态的环境下进行,这就和真实世界中开放动态的应用场景存在一定的差异性
Tube Feature Aggregation Network(TFAN)新方法,即利用时序信息来辅助当前帧的遮挡行人检测,目前该方法已在 Caltech 和 NightOwls 两个数据集取得了业界领先的准确率
根据各种指法的具体特点,对时频网格图、时域网格图、频域网格图划分出若干个不同的计算区域,并以每个计算区域的均值与标准差作为指法自动识别的特征使用,用于基于机器学习方法的指法自动识别
新加坡国立大学NExT中心的王翔博士分析了知识图谱在个性化推荐领域的应用背景,并详细介绍了课题组在个性化推荐中的相关研究技术和进展,包括基于路径、基于表征学习、基于图神经网络等知识图谱在推荐系统中的融合技术