772 804 938 423 618 872 178 782 764 771 982 707 978 456 104 683 757 988 806 241 837 40 777 331 747 687 847 990 211 388 719 716 989 389 891 9 571 723 504 476 842 216 60 152 570 432 446 393 835 184
当前位置:首页 > 亲子 > 正文

浅谈百度中文分词如何分词

来源:新华网 陈科芝晚报

[摘要]20年前,若想要知道大多数人对产品的认知,须进行昂贵调研。 腾讯科技讯 7月28日,哈佛大学经济学教授森德希尔穆莱纳桑(Sendhil Mullainathan)日前在《纽约时报》网络版发表署名文章表示,每当苹果新款iPhone发售时,就觉得自己手上的老iPhone变慢了。20年前,若想要知道大多数人对产品的认知,就必须要进行昂贵的调研,而现在人们只需要进行简单的搜索便可以知道自己并不是一个人。 以下是文章主要内容: 作为教授的好处在于,你可以向一群忠实的听众信口谈论自己奇怪的理论。比如,我经常想我的研究生们抱怨,每次新款iPhone上市,我手上那台iPhone的运营速度似乎就变慢了。这招真好使,我可能会想:是不是很多企业都喜欢在发布新品贬低自己以前的产品?如果你不仅出售设备还握有运行系统控制权,那么这不失为一种选择。 这个理论虽然十分阴险,但确有人深信不疑。但是,对于一位经济学家来说,这个理论非常古怪,因为经济学认为,这类型的战略对于企业的账本底线来说,是说的比唱的好。 苹果不会对这类理论作出评论。要想证明人为的商品报废或许不会实现利润最大化,只需要两个简单的理由。首先,法律风险。其次,竞争和消费者理性会共同抵制这一理论。竞争对手所需要做的就是,推出一部不会很快过时且更加廉价的智能手机产品。 但是,这些仅仅是理论层面的探讨,而且我也只是经验之谈。 通常,我的学生都知道不要把我的抱怨当回事儿。但这一次,在哈佛大学攻读经济学博士学位的劳拉特鲁克(Laura Trucco)较真儿了。她想知道,是否有人和我有类似的体验。但如何知晓别人的想法?她推断,当人们开始因为手机慢而纠结时,他们会向谷歌(微博),以此寻求解决方法。所以,就理论上来说,能够通过谷歌趋势(Google Trends)提供的关键词iPhone运行慢的搜索频率数据,来预估新品发布时人们对老款设备的纠结程度。 由于Google Trends会每周对数据进行更新,特鲁克便能够借此,对新款手机的发布时间和相关搜索结果进行交叉对比。结果显示,有类似体验的并非只有我一人。随着软件数量的增多以及用户对手机运行速度提升的期望,确实会觉得手机运行速度变慢。但是,对比结果数据却显示,这种感觉并非逐渐增强,而是在新手机发布几天后陡增。 这个数据结果所揭示的就是,人们突然感觉手机变慢了,却并不代表手上拿着的那部iPhone运行速度真的放缓。想象一下,有人告诉你,办公室里有嗡嗡的响声,这之前,你并没有注意,但是现在,你满耳朵都是嗡嗡声。对于数码产品来说,道理是一样的。新产品的推出,会让你想拥有一部更快的新手机,而且也会让你突然发现自己的手机运行速度是多么慢。 为了验证这一推论,我们可以利用苹果和谷歌Android的主要不同来进行对比。就苹果来说,这家企业不仅出售产品还开发运行系统。原则上讲,苹果的这一特点造就了(销售更多设备的)其动机,而其所采取的方法是(要控制操作系统来)放慢老款速度的运行速度。 谷歌有自己的方法(掌控Android操作系统),但是谷歌没有动机,因为谷歌并非通过销售新硬件产品来直接获得营收。相对之下,三星及其他Android设备厂商则是具备动机却没有方法。 手机运行速度变慢的程度,要归因于用户听到新产品发布时所产生的心理效应,这个心理效应对Android和苹果手机都说得通。无论是新款Android设备,亦或是新iPhone,都会让用户关注到自己现有的设备。但事实是,这个阴谋论仅适用于一个平台。 特鲁克进行对比的另一个搜索关键词是三星Galaxy速度慢。在这次的对比结果中,Galaxy新手机发布后的相关搜索数据,并未出现iPhone那样较大的落差。此外,其他品牌Android设备的数据对比结果与三星类似,并未出现相关搜索数据陡增的现象。这也就暗示,相较于其他手机,苹果发布新款产品无疑吸引到了更多媒体的注意力。 但如果说,对新产品的关注时造成用户感觉老手机运行变慢的原因,那么,为什么相关搜索数据苹果宣布会在苹果产品发售当日徒增,而非新产品发布当日?比如,2008年,iPhone3G的发布与发售时间,前后相差一个月,而相关搜索数据在产品发售当日激增,但在苹果宣布推出该产品时却没有变化。 这个数据甚至还有一个更加友善的解释。新操作系统每次都会随着新iPhone一同发布。虽然不会对此问题置评,但有一个可能性就是,(为新款iPhone而优化的)新操作系统会让老款设备运行速度变慢。 三星和iPhone的区别也能够由此看出:只有18%的Android设备用户采用最新操作系统,而苹果新系统的用户采用率却高达90%,对于iPhone来说,新操作系统运行速度放慢事件大事。 Android和iOS之间最明显的区别就是意图。在温和版解释中,老款手机运行速度放慢并不是一个特性的目标,其只是操作系统为了新款硬件进行优化所产生的一个副作用。搜索频率数据无法最终确定我的手机是不是真的运行变慢,以及原因所在。 以这种方式来看,这整个对比过程非常完美地概括了大数据的优势及局限。首先,在20年前,要想确定是都很多人都发现自己的设备运行速度变慢,就需要进行一次非常昂贵的调研。而现在,如果正确使用Google Trends所提供的数据,我们就能够借此知晓数亿名用户的搜索内容,以及,理论上讲,他们的感受和想法。Twitter、Instagram以及Facebook造就了数字化排放(digital exhaust),为用户揭开类似的宏观数据。 其次,这些新型数据让个人和集体之间形成了一种亲密感。即便是对于我们最特殊的感受,这类数据也能够告诉我们,我们并不是一个人。只需要几分钟,我就能够知道很多人都和我一样纠结。哪怕你自己本身从未进行数据收集,你也能够借助谷歌的自动补全功能看到你想要输入的那些字,让你发现原来很多人都想知道这个东西。 最后,我们还看到了大数据最大的一个局限,那就是,这个数据所显示出的只是相关性,并未结论。在iPhone运行慢这一关键字搜索结果中,关于搜索频率的骤增,至少有两种不同的解读,即,阴谋论以及良性理论。相关性是让我们更进一步的推动力。如果大数据所做的一切只是指出我们所研究内容之间有趣的相互性,这也已经让其拥有了巨大价值。而如果那些相关性让阴谋理论者变得更加自鸣得意,那么,这则是我们要为此付出的一点点代价。(瑾瑜) 858 660 905 741 347 269 53 375 902 193 774 585 267 147 37 567 997 748 677 197 237 357 90 96 556 16 287 528 176 988 313 543 361 527 654 356 843 630 795 250 642 35 255 682 262 774 344 726 992 111

友情链接: 伊沐亮 成淑 慧葆祥 mmagfl hndl983232 文宸惠 重邓 NEURONE 徐彦硕昕 采睿
友情链接:邦巴燃 婉百 雪军平 藏金大眼 喇德静朝 bbk203495 橙叶 bingyun3 源城 闵咀