搜索
虾皮社区 首页 新闻资讯 查看内容

谷歌搜索 智能还是危险?

2018-8-15 06:01| 发布者: happyxp| 查看: 2068| 评论: 0

摘要: 原标题:谷歌搜索,智能还是危险?记得上个星期,人民日报被删的那条Twitter 闹了不小风波。。可惜虚晃一枪,什么也没有发生,倒是李彦宏的那条朋友圈很有意思~李总对百度的技术非常有信心,并自认为在中国,凭借技 ...

原标题:谷歌搜索,智能还是危险?

记得上个星期,人民日报被删的那条Twitter 闹了不小风波。。

可惜虚晃一枪,什么也没有发生,倒是李彦宏的那条朋友圈很有意思~

李总对百度的技术非常有信心,并自认为在中国,凭借技术和创新方面可以打败谷歌,并不担心谷歌入华。

结果转天就被网友们打脸。。。

百度上的“ 滑嫩”、“ 鲜嫩” 等全是美女图片,而谷歌上搜索这些内容,出现的则是一些美食等。emmm。。高下立判。。。

被爆料后,百度程序猿们加班加点,总算是把大家揪出来的敏感词汇处理了。

可是,今天发生的一件事,让差评君意识到,不仅仅是搜索算法,谷歌在另外一个方面早就超过了百度。。。

下午差评君在调查黑产,用百度搜索了一个QQ 号,网页版的内容基本就是胡乱凑的,而图片搜索空空如也,什么结果也没有。

不死心的差评君又用谷歌试了一下,结果。。。

给你们看一下大图。。。

居然真的把差评君想要的搜索了出来,而且,因为这个QQ 涉及黑产,所以骗子只把它放在图片里,并没有放到网页上。

也就是说,Google 现在已经开始对互联网上的图片文本做了识别提取,并建立索引!

在我们的印象中,搜索引擎一般会基于图片旁边的文字描述给图片打标签,或者利用神经网络识别图片上的物体,并不会扫描读取图片上的文本内容。

用神经网络给图片分类

用神经网络给图片分类

所以很多时候你搜索图片上的文本,搜索引擎不会给你返回正确结果。

不知道什么时候,谷歌已经偷摸给自己的搜索引擎升了个级!?

为了看一下谷歌的图片识别文本已经达到什么程度,差评君开启了疯狂验证模式。。。

首先,要验证下,是不是图片上数字都可以被识别出来~

Emmm,先搞一个身份证号搜索看看。这个是百度的结果:

再用谷歌搜索一下?

额。。有没有感到一丝丝害怕?!想想自己有没有曾经在网上上传过身份证照片?如果被泄露到互联网上,可以直接通过身份证号获得身份证图片,这后果有点严重。

差评君借用了一个小伙伴的身份证前几位,分别在百度和谷歌上搜索“ 1201031993 ”,百度依然什么也搜不出来,而谷歌返回了一堆结果。

这些图片上无一例外的有1201031993 这几个数字。。。

令差评君意外的是,谷歌在对图片文本提取时,已经不仅仅是用的最简单最基础的图像识别。

像上面第二张图片中那几个数字是竖过来,但谷歌依旧识别正确,说明谷歌的识别算法会自动匹配文本的旋转角度。

如果不是纯数字,带上英文呢?只在图片上有,网页上没有出现过的文本还真不好找,最后差评君试了个汽车图片,把车牌号“ A·K8896 ” 搜了一下。

嗯,百度出来的都是八竿子打不着的图片,正常。

那,谷歌呢。。?

大家也可以试试自家的车牌能不能被搜到

大家也可以试试自家的车牌能不能被搜到

给,这是差评君十年份的膝盖,请收下。。。

这张图片正是差评君随机找的一张汽车图片,谷歌这项技术,连隐藏在车身下不那么明显的车牌号都揪了出来,够强大。

最后一个问题,谷歌能不能识别图片中的中文?

经过试验,还好还好,中文目前还是谷歌图片未攻克的堡垒,目前看来,谷歌只对图片中的字母和数字进行了识别。

搜索了文中第一个例子中图片的中文,没有返回该图片

搜索了文中第一个例子中图片的中文,没有返回该图片

不过差评君好奇的是,谷歌搜索引擎是什么时候开始识别图片文本的?

谷歌没有给出过官方消息,相关的讨论也寥寥无几,2016 年的时候谷歌的大佬还否认过谷歌在识别图片文本。

不过在去年7 月的时候,有一个博客主跟差评君有相似的发现,所以至少去年谷歌就已经偷偷升了级~

其实,谷歌很早就积累了图片的文本识别相关技术—— OCR ( 光学字符识别)。

这个技术本身并不难,最早谷歌将OCR 应用在书籍扫描转换文本上,这样只要你搜索书中的一句话,它就能推给你正确的书籍。

谷歌解析图片文本的专利

谷歌解析图片文本的专利

现在,谷歌已经将这项技术应用在互联网的所有图片上。

差评君之所以感到惊讶,是因为我们每天要产生大量图片,光在Facebook 和Instagram 上每天就产生近4 亿张图片,微博上每天产生1.5 亿张图片,保守估计互联网上每天要多出8 亿图片。

而谷歌对每张图片都进行OCR 算法处理,获取里面的文本信息,这是一项海量的工程,消耗太大了。但谷歌还是做到了。

Google 实时翻译也是用的OCR 技术

Google 实时翻译也是用的OCR 技术

这样大大提高了大家使用搜索引擎的效率,让大家更容易找到自己想要的结果~

不过在以前,正是因为大家默认搜索不出图片上的文本,才会放心的把一些资料保存成图片放到网上。

现在随着这项技术的成熟,恐怕图片也不再保险。。。谁能想到一个身份证号,就把身份证图片都搜出来了呢?

如何兼顾技术和隐私,恐怕未来需要谷歌好好处理一下~

iiiiiiiiii

图片来源:1. 新视角,李明明2. 北美留学生日报3-5、7-15. 差评6. damon 16. Techgyst

参考资料:

1.《用谷歌和百度同时搜索“鲜嫩、滑嫩、胸膜”等词后…李彦宏赢了》,北美留学生日报

2.《 Google: No, We Don't Understand Text In Images 》,Barry Schwartz

3.《 How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read 》,Bernard Marr

4.《Does Google Read Text in Images? NEW Evidence Says Yes!》,Steve Toth

5.《互联网上一天产生的流量,到底有多少?》,财经头条

iiiiiiiiii

“ 吓得我赶紧把微博里面的图片都删了。。 ”


路过

雷人

握手

鲜花

鸡蛋
相关热门新闻
中国网友怼美国共和党前亚太区主席方文格指责中国网友不同情犹太人
中国网友怼美国共和党前亚太区主席方文格指责中国网友不同情犹太人
方文格先生你好: 看到你对网友的回复,我感到无比的震惊且愤怒。你所谓的二战期间如果全世界帮助犹太人,600万犹太人就不会被杀的言论,我要反驳的是,这不能成为你们屠杀巴勒斯坦人的理由。另
向以色列捐款的品牌有哪些
向以色列捐款的品牌有哪些
帮助捐款给以色列的品牌有:派拉蒙,迪士尼,宝洁,乐事薯片,可口可乐,百事可乐,品客薯片,士力架,欧莱雅,LV,香奈儿,麦当劳,肯德基,汉堡王,必胜客,星巴克,沃尔玛,谷歌,雀巢等等 ...
常见被误认为国的外国品牌
常见被误认为国的外国品牌
盘点那些你以为是国货的外国品牌 1.金龙鱼 新加坡 2.中华牙膏 英国 3.红牛 泰国 4.脉动 法国 5.飘柔 美国 6.大宝Sod 美国 7.潘婷 美国 8.海飞丝 美国 9.伊卡璐 美国 10.舒
广电总局已经采取行动,大批电视直播应用程序被迫关闭
广电总局已经采取行动,大批电视直播应用程序被迫关闭
以往,看电视是件愉快的事,但现在看电视却成为一件费时又花钱的烦心事。近来,有关电视“套娃”收费、广告多、操作复杂的投诉不断。为治理“看电视难、看电视烦”的问题,今年8月,国家广电总
我们国家最大的敌人是谁?
我们国家最大的敌人是谁?
很多美国的远程养殖产品(就是狗汉奸)把我们的解放战争称为内战。没错,形式上是内战,但本质上却是一场在党的领导下,人民军队反抗美帝及其代理人,谋求民族解放独立的外战。 我这么说,光头
外部势力对于咱们的舆论入侵是如何操作的
外部势力对于咱们的舆论入侵是如何操作的
外部势力对于咱们的舆论入侵是如何操作的呢? 其实他抓住的就是人性而已。 舆论入侵也就是舆论战,准确一点的解释就是境外势力利用扰乱舆论的方式破坏我们的内部团结,制造地区分裂、民族分裂、
开放麒麟openKylin1.0中国首个开源桌面根操作系统诞生!
开放麒麟openKylin1.0中国首个开源桌面根操作系统诞生!
7月5日,中国首个开源桌面根操作系统“开放麒麟”(openKylin)1.0正式发布,这一重要成果获得了众多权威媒体的关注和报道。开放麒麟1.0是由国家工业信息安全发展研究中心等单位指导推动研发的
离职两年后,程序员遭前公司索赔:Bug 是你写的
离职两年后,程序员遭前公司索赔:Bug 是你写的
问:身为一名程序员,你能确保至今写的代码中没有一个 Bug 吗?程序员:当然不能。问:那你不怕这些 Bug 导致重大损失,然后公司起诉你吗?程序员:哈,还有这样的事?嗯,确实有的,甚至还发生
雷达专家与船舶设计软件:David Vacanti的成功故事
雷达专家与船舶设计软件:David Vacanti的成功故事
David Vacanti,一个雷达专家,毕业于科罗拉多州立大学并加入波音公司以设计雷达,长达21年。1998年,他转投霍尼韦尔公司继续从事雷达研究,工作了19年。与雷达打交道是他的终身事业。然而令人
国产OS系统deepin成立AI社区
国产OS系统deepin成立AI社区
AI技术成为各大科技公司不得不抓的浪潮,操作系统领域也是如此,微软计划在Win12中大量引入AI技术重塑体验,国内的OS也要跟进了,深度deepin今天就宣布成立了AI SIG社区。深度操作系统公众号介

虾皮社区,成立十年了!

站长自己也搞不懂想做个什么,反正就是一直在努力的做!

Copyright © 2007-2024 xp6.org Powered by Discuz

QQ|Archiver|手机版|小黑屋|虾皮社区 |网站地图
返回顶部