社交网站的数据挖掘与分析 【Matthew A.Russell】

社交网站的数据挖掘与分析 【Matthew A.russell】
社交网站的数据挖掘与分析 【Matthew A.russell】 2

社交网站的数据挖掘与分析 【Matthew A.Russell】

mobi+epub+azw3

本站所有资源均来自网络,版权归原作者所有,本站仅提供收集与推荐,若侵犯到您的权益,请【给我们反馈】,我们将在24小时内处理!

作 者:Matthew A.Russell (作者)
出版社:机械工业出版社; 第1版 (2012年2月9日)
类型:计算机/科学
书籍语言:中文
标签:计算机与互联网, 自动化技术, 数据仓库与数据挖掘, 数据库, 计算机/网络, 数据挖掘, 社交网站, 互联网, 数据分析, 统计学, 机器学习

《社交网站的数据挖掘与分析》电子书亚马逊售价:21.80元                     

豆瓣评分:6.8分

编辑推荐:

  “本书是《Programming CollectiveInelligence》一书的深入篇,它介绍通过Python从社交网站中采集数据的一种实践方法。”
   ——Jeff Hammerbacher,Cloudera 的首席科学家


  “对于探索结构化和非结构化数据的一系列工具、技术和理论,本书给出了丰富、紧凑并实用的介绍。”
——Alex Martelli, Google的高级主管工程师,《Python in aNutshell》的作者


“这是一本非读不可的书,因为现在的数据都散落在各处,令人眼花缭乱。[Matthew]Russell 这位API 达人、社交媒体专家(当然他更像是数据方面的科学家)在社交媒体数据挖掘方面巧妙地开创了先河。”
  ——Nick Ducoff,Infochimps 公司CEO


“这是一本能让你了解新一代在线数据资源挖掘技术的重要指南。Russel做了件很了不起事,他为社交网站的从业人员准备了一本通俗易读的操作手册,涵盖了如何存取数据以及如何从原始数据中提取有价值的信息的简单方法。”
  ——Pete Warden,OpenHeatMap.com 创始人

“每当我参与的项目涉及社交数据分析时,本书肯定是我的必备参考书。书中有很多有用的示例,如果你正开发与数据挖掘相关的项目,那么我郑重向你推荐本书。本书不仅对初学者有用,对数据挖掘的资深人士也极具参考价值。”
  ——Abe Music,Zaffra 公司总裁


“作者编写本书时肯定乐在其中。他很巧妙地将传统的文本、图形挖掘库与时下流行的社交媒体应用联系到了一起。其示例既言之有物又不失简洁性,不但为读者提供了有价值的建议,也为读者进行更深入的开发和探讨提供了帮助。不论是对于刚涉足社交网络数据挖掘的新手,还是需要了解社交媒体API的资深研究人员来说,本书都是一本很好的指南。”   ——Chris Augeri,Nebraska 大学高级研究员

“对任何想涉足社交数据挖掘的人来说,这都一本非常好的书。作者进行了深入研究,从第1章开始就提供了丰富的示例。它不但易懂而且很有趣。如果你对社交网络数据的挖掘、分析和可视化感兴趣的话,那么本书是你的。”
  ——Jeffrey Humphries 博士;计算机科学家


“在未来几年中,几乎没有任何事情可以阻碍我们通过软件自动了解人际交往方式的脚步。这个话题广博而精深。它一直是众多学术论文和学位论文的研究主题。Matthew真的是将一些容易忽略的东西联系到了一起:他对一系列庞杂而深奥的技术以及埋没在社交网站内的人际沟通方面的知识进行了很实用的讲解。本书出自一位技术高人之手——他对新工具的编程技术了如指掌。本书将为你打开软件未来十年走向的大门。”
  ——Tim Estes,Digital Reasoning Systems 公司创始人、CEO


“本书告诉你如何最有效地利用Twitter API 。”
  ——Raffi Krikorian,Twitter 公司平台服务组

“Matthew精心挑选的这些数据源、分析技术、数据管理工具以及可视化方面的话题都非常有趣,全面体现了“如何从社交网络获取有价值的信息”领域的*思想。他举的例子很生动,是进行深入研究很好的起点。Matthew非常在乎读者能否理解这些材料;本书随处都给出了适时、适用且真正有帮助的提示和建议。本书能激发我深入研究数据进而分析这一领域的兴趣。”
  ——Roger Magoulas,O’Reilly Media 公司市场研究总监

内容简介:

《社交网站的数据挖掘与分析》介绍组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及那些你都不知道存在的有用信息。每个独立章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。

主要内容包括:获得社交网络世界里的直观概要,使用GitHub上灵活的脚本来获取社交网络API中的数据,学习如何应用便捷的Python工具来交叉分析你所收集的数据,通过XHTML朋友网络探索基于微格式的社交联系,通过基于HTML5和JavaScript工具集的网络技术建立交互式可视化等。

Facebook、Twitter和Linkedln产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网站数据、分析技术,如何通过可视化找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。

《社交网站的数据挖掘与分析》每章都介绍了在社交网络的不同领域挖掘数据的技术,

作者简介:

马修·罗塞尔(Matthew A. Russell),Digital Reasoning Systems公司的技术副总裁和Zaffra公司的负责人,是热爱数据挖掘、开源和Web应用技术的计算机科学家。他也是《Dojo: The Definitive Guide》(O’Reilly出版社)的作者。在Linkedin上联系他或在Twitter关注@ptwobrussell,可随时了解他的*动态。

目录:

《社交网站的数据挖掘与分析》
前言 1
第1章绪论:Twitter 数据的处理 9
Python 开发工具的安装 9
Twitter 数据的收集和处理 11
小结 24
第2章微格式:语义标记和常识碰撞 26
XFN 和朋友 27
使用XFN 来探讨社交关系 29
地理坐标:兴趣爱好的共同主线 37
(以健康的名义)对菜谱进行交叉分析 41
对餐厅评论的搜集 43
小结 45
第3章邮箱:虽然老套却很好用 47
mbox:Unix 的入门级邮箱 48
mbox+CouchDB= 随意的Email 分析 54
将对话线程化到一起 70
使用SIMILE Timeline 将邮件“事件”可视化 79
分析你自己的邮件数据 82
小结 84
第4章Twitter :朋友、关注者和Setwise 操作 85
REST 风格的和OAuth-Cladded API 86
干练而中肯的数据采集器 90
友谊图的构建 108
小结 116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
笔PK 剑:和tweet PK 机枪(?!?) 118
对tweet 的分析(每次一个实体) 121
并置潜在的社交网站(或#JustinBieber VS #TeaParty) 144
对大量tweet 的可视化 155
小结 163
第6章LinkedIn :为了乐趣(和利润?)将职业网络聚类 164
聚类的动机 165
按职位将联系人聚类 167
获取补充个人信息 183
从地理上聚类网络 188
小结 192
第7章Google Buzz:TF-IDF 、余弦相似性和搭配 194
Buzz=Twitter+ 博客(???) 195
使用NLTK 处理数据 198
文本挖掘的基本原则 201
查找相似文档 208
在二元语法中发Buzz 215
利用Gmail 221
在中断之前试着创建一个搜索引擎…… 225
小结 226
第8章博客及其他:自然语言处理(等) 228
NLP :帕累托式介绍 228
使用NLTK 的典型NLP 管线 231
使用NLTK 检测博客中的句子 234
对文件的总结 237
以实体为中心的分析:对数据的深层了解 245
小结 256
第9章Facebook :一体化的奇迹 257
利用社交网络数据 258
对Facebook 数据的可视化 274
小结 294
第10 章语义网:简短的讨论 296
发展中的变革 296
人不可能只靠事实生活 297
期望 301

给TA打赏
共{{data.count}}人
人已打赏
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索