社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【泡泡新闻社】周报05期 | 能在任何表面作画的机器人;谷歌黑科技,深度学习视听模式;喊你直接与书对话了!自动驾驶汽车的眼睛

泡泡机器人SLAM • 7 年前 • 643 次点击  

选文&评论  |  张一 丁建峰 许峰 金明 

校对&编辑  |  李韩超 

泡泡机器人推广内容组编译作品

Scribit:能在任何表面作画的机器人

图片来源:Newatalas


几年前,建筑设计公司Carlo Ratti Associati (CRA)展示了一个系统,用喷漆的无人机在墙上作画。尽管这种想法有些炫酷,但无法成为商业化的产品。最近,该公司发布了他们新的产品:墙体绘图机器人Scribit。就像该公司2015年一次性垂直绘图仪的小型室内版本一样,Scribit在垂直表面(如墙壁,窗户或白板)上的2轴平面上移动,同时绘制图像或文字。铝质环形装置由两根轻型斜拉索悬挂,据报道可在短短五分钟内完成安装,只需“两根钉子和一个电源插头”。 它配备了四种不同颜色的可擦除标记以及一张橡皮擦,当用户对绘制的图案不满意,可以删除旧图纸,并让它在同一区域创建新作品。用户使用应用程序将图像或文本上传到连接互联网的机器人,并指明所需绘制的该内容的空间的尺寸即可。


CRA将于4月16日在米兰的Salone del Mobile设计活动上正式推出Scribit。众筹活动随后将于6月5日开始,单位的最低抵押额为199欧元(约合244美元)。有了该机器人,以后的墙体绘画工作可就简单有效的多了。


“壁虎抓手”:超强黏附能力的柔软机器人抓手

图片来源:robotics.sciencemag.org


众所周知,壁虎具有超强的黏附能力,这些聪明的生物利用它们的脚和腿上数以百万计的微小毛发,在分子水平上与物体表面结合,给它们提供难以置信的抓地力。受此启发,斯坦福大学(Stanford University)、加州大学圣地亚哥分校(UCSD)和美国宇航局喷气推进实验室(JPL)的研究人员最近展示了他们发明的一种机器人抓手,能举起重达45磅的重物。


通过使用光刻技术研究者们开发了一种合成材料,这种材料模仿了壁虎的自然抓取能力,可以用来覆盖柔软的机械爪的手指。结合控制算法,让机器人在整个手指的长度上分配适量的力,最终得到一个可以举起各种物体的夹子,最重可达45磅(20公斤)。这包括粗糙的,多孔的物体,如火山岩石,光滑的物体,像圆柱管,和日常的东西,像咖啡杯和西红柿。


日常生活中,这种抓手能给我们带来极大的便捷,更为重要的是,机器手上的粘接剂可关闭或开启,有望帮助国际空间站外工作的宇航员抓住太空漂浮物体碎片,清理回收威胁日益增大的太空垃圾。


Google黑科技--深度学习视听模式

图片来源:Google


对于我们人类而言,在嘈杂的环境中分离出我们希望听到的声音,这就是所谓的鸡尾酒派对效应。谷歌希望让计算机更好地听到我们想要听到的声音,并开发出一种新的深层学习视听模型,用于从混合语音中分离单个语音信号。

 

该技术的独特之处在于它将输入视频的听觉和视觉信号结合起来,以分离语音。该方法采用人的嘴部运动并将其与人在说话时产生的声音相关联。这使模型能够确定音频的哪一部分与该人共享, 用户必须做的是选择他们想要听的视频中人物的脸部。

 

Google通过收集来自YouTube的100,000份高质量讲座和演讲,生成了训练示例。它能够以清晰的语音提取片段。该数据使Google能够训练基于多流卷积神经网络的模型,将合成混合鸡尾酒混合物分解为视频中每个扬声器的独立音频流。这种训练可以让网络为每个扬声器单独设置编码,并且这种联合表示允许网络学习为每个扬声器输出一个时频掩码。然后这些信号乘以噪声输入频谱并转换回时域波形以获得期望的隔离干净语音信号。


CEVA-XM6机器视觉与深度学习平台,荣获2018“视觉系统设计创新奖”


4.11在波士顿举行的第四届嵌入式视觉系统设计中,CEVA-XM6机器视觉与深度学习平台摘得创新奖。创新奖的评选主要依据创意,硬件设计、系统集成、终端用户和满足市场上尚未解决的需求。


CEVA-XM6计算机视觉和深度学习平台帮助设计师将先进的人工智能(AI)能力引入到嵌入式设备中。综合可扩展、集成的硬件和软件平台,以创新和整体性的方式应对终端设备计算机视觉和深度学习的挑战。作为CEVA的第5代成像和计算机视觉平台,CEVA-XM6平台充分解决了嵌入式设备中计算机视觉和神经网络用例的全部问题,允许开发者有效地利用神经网络和机器视觉的性能应用于智能手机、自动车辆、监视、机器人、无人机和其他支持摄像头的智能设备。要了解更多关于CEVA平台和处理器的信息,请访问https://www.ceva-dsp.com/app/learning/。


谷歌喊你直接与书对话了!顺带练一下词汇联想

图片来源:.theverge.com


人工智能领域的领头羊谷歌近日宣布了一项新的人工智能实验,允许网络用户体验语义和自然语言处理。


在公布的两项公开实验中,第一项叫做“与书对话”,它可以让你用机器学习训练的算法进行对话,该算法可以从人写的文本中找到相关段落的答案。与书交谈可以让你“做一个陈述或问一个问题,而这个工具会在回应的书中找到句子,而不依赖于关键字匹配。”从某种意义上说,你是在和书交谈,得到回应,这可以帮助你确定你是否对阅读感兴趣。


从使用web界面的经验来看,它是一款非常整洁、完美的产品。问它一个像“为什么天空是蓝色的?”“你会得到很多不同的答案,这些答案都是在清晰的文本中显示出来的,这些答案来自于关于这个主题的书籍,比如,”随着波长的减少,大气中的分子的光线散射会变得更强。但是,与使用标准的谷歌搜索和必须点击链接并解析文章或网页不同,与书籍算法的对话对你有用。


一旦你问了你的问题(或者做了一个陈述),这些工具就会在超过10万本书中搜索所有的句子,找出那些根据句子层面的语义含义对你的输入做出反应的句子;你所输入的和你得到的结果之间的关系没有预先定义的规则。


第二个实验则更具互动性。这是一款叫做Semantris的游戏,它主要测试你的单词联想能力,就像一个软件一样,它能让你和书里的人交流,并根据你输入的答案在屏幕上打分。举个例子,如果你把“床”这个单词放在一个10个单词的最上面,你可能会把“睡眠”作为一种反应。Semantris将对这10个单词进行排序,并根据它认为床与睡眠之间的语义关系与列表中的其他单词之间的关系进行比较。


自动驾驶汽车的眼睛,Luminar新发布廉价激光雷达

图片来源:Luminar Technologies Inc.


自动驾驶汽车正处在黄金发展时间,作为自动驾驶汽车的眼睛,激光传感器的市场也在快速发展壮大。通过每秒发射数百万激光点并测量反弹时间,激光雷达能建立汽车周围环境的三维地图,进而定位汽车并提供导航。然而数十年来,如果你想要自动驾驶汽车的激光雷达,Velodyne公司价格高昂的激光雷达产品是为数不多的选择。


最近,硅谷创业公司Luminar,宣布推出其最新的激光雷达装置,向Velodyne发起挑战。该激光雷达具有120度的视野(足以看清车前的情况,但需要一对才能获得360度的视野),采用了短波激光脉冲,可更好地探查到车辆周边的目标物,其画面清晰度远高于雷达设备所采集的图像。 同时,由于自主研发生产的激光雷达接收元件(最昂贵也最为重要的部分),整个装置的成本大幅降低。在去年刚开始只能生产100台后,Luminar声称他们已经具备了数千台的产能——足以满足今天的需求, 也许,在不久的未来能够为每一辆自动驾驶汽车提供低成本的激光雷达组件。



#泡泡机器人新闻社-往期回顾#

【泡泡新闻周报】KAIST韩国科学院遭学术界联合抵制;可穿戴设备做到“听”你所想;深度学习尝试理解视频

【泡泡新闻社】新闻周报 03期


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/dcuak2jPHP
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/10537
 
643 次点击