这里写目录标题
前言一. 社交网络的结构特性与演化机理1. 社交网络结构分析与建模1.1 统计特性1.2 网络特性1.3 网络模型
2. 虚拟社区(社团)及发现技术2.1 定义2.2 社区发现算法评价指标2.3 社区静态发现算法2.4 社区动态发现算法
3. 虚拟社区演化分析3.1 虚拟社区的涌现3.2 虚拟社区的演化3.3 演化虚拟社区的发现
二. 社交网络群体行为形成与互动规律1. 用户行为分析1.1 用户采纳与忠诚1.2 用户个体使用行为1.3 用户群体互动行为
2. 社交网络情感分析2.1 文本情感分析技术2.2 社交网络情感分析技术
3. 个体影响力分析3.1 基于网络结构的个体影响力计算3.2 基于行为的个体影响力计算3.3 基于话题的个体影响力计算
4. 群体聚集及影响机制分析
三. 社交网络信息传播与演化机理1. 在线社交网络信息检索1.1 社交网络内容搜索1.2 社交网络内容分类1.3 社交网络推荐
2. 社交网络信息传播规律2.1 基于网络结构的传播模型2.2 基于群体状态的传播模型2.3 基于信息特性的传播模型
3. 话题发现与演化3.1 基于主题模型的话题发现3.2 基于向量空间模型的话题发现3.3 基于词项关系图的话题发现3.4 基于主题模型的话题演化3.5 基于相邻时间片关联的话题演化
4. 影响力最大化4.1 贪心算法4.2 启发式算法
四. 社交网络分析的应用1. 社交推荐2. 舆情分析3. 隐私保护4. 用户画像5. 谣言检测6. 可视化
五. 社交网络前沿研究六. 学习资料
前言
社交网络在维基百科的定义是“由许多节点构成的一种社会结构。节点通常是指个人或组织,而社交网络代表着各种社会关系。”在互联网诞生前,社交网络分析是社会学和人类学重要的研究分支。早期的社交网络的主要指通过合作关系建立起来的职业网络,如科研合作网络、演员合作网络等。
本文所指的社交网络分析专指在线社交网络分析(online social network analysis),该门科学的发展是随着在线社交服务(social network service, sns)的出现而诞生。在线社交服务的种类大致可分为四种:即时消息类应用(qq、微信、whatsapp、skype 等),在线社交类应用(qq空间、人人网、facebook、google 等),微博类应用(新浪微博、腾讯微博、twitter 等),共享空间类应用(论坛、博客、视频分享、评价分享等)。
在线社交网络(下文统称社交网络)有着迅捷性、蔓延性、平等性与自组织性等四大特点。正因为这些特性,其在互联网出现的短短数十年内已经拥有数十亿用户并对现实社会的方方面面产生着影响。在2016年的美国总统大选中,当选总统特朗普就很好地利用了推特作为宣传工具;而在国内,从魏则西事件到和颐酒店事---件再到最近的“刺死辱母者”事件,无一不是在社交网络上迅速发酵,并最终对现实社会产生影响。而且这种线上影响线下的趋势越来越明显。
除了社交网络给社会和经济带来许多正面影响之外,也带来了不少负面影响。从facebook 和 youtube上的暴力恐怖信息传播到微博微信上大量谣言和假新闻,这些有害信息借助社交网络的特点迅速传播并且往往产生不可控的后果。
为了利用好社交网络的特性,产生价值,消除危害,所以产生了社交网络分析这门科学。它是一种基于信息学、数学、社会学、管理学和心理学等科学的交叉科学。根据社交网络的特性,其主要研究三大内容:结构与演化,群体与互动,信息与传播。
本文简要概述了社交网络分析领域各个研究方向,对于细节性的内容我只列出参考文献,在文章最后提供了一些学习资源。 希望通过阅读本文,对这个领域感兴趣的读者可以对社交网络分析有一个宏观理解并且找到学习的方向。笔者作为社交网络分析的初学者,对某些概念和事实的解释和陈述不免有错误之处,还望各位读者能及时指正,大家共同交流进步。
一. 社交网络的结构特性与演化机理
1. 社交网络结构分析与建模
1.1 统计特性
社交网络模型许多概念来自于图论,因为社交网络模型本质上是一个由节点(人)和边(社交关系)组成的图。笔者将简要介绍社交网络模型中常用的统计概念。
度(degree):节点的度定义为与该节点相连的边的数目。在有向图中,所有指向某节点的边的数量叫作该节点的入度,所有从该节点出发指向别的节点的边的数量叫作该节点的出度。网络平均度反应了网络的疏密程度,而通过度分布则可以刻画不同节点的重要性。
网络密度(density):网络密度可以用于刻画节点间相互连边的密集程度,定义为网络中实际存在边数与可容纳边数上限的比值,常用来测量社交网络中社交关系的密集程度及演化趋势。
聚类系数(clustering coefficient):用于描述网络中与同一节点相连的节点间也互为相邻节点的程度。其用于刻画社交网络中一个人朋友们之间也互相是朋友的概率,反应了社交网络中的聚集性。
介数(betweeness):为图中某节点承载整个图所有最短路径的数量,通常用来评价节点的重要程度,比如在连接不同社群之间的中介节点的介数相对于其他节点来说会非常大,也体现了其在社交网络信息传递中的重要程度。
1.2 网络特性
小世界现象:小世界现象是指地理位置相距遥远的人可能具有较短的社会关系间隔。早在1967年,哈佛大学心理学教授 stanley milgram 通过一个信件投递实验,归纳并提出了“六度分割理论(six degrees of separation)”, 即任意两个都可通过平均五个人熟人相关联起来。1998年,duncan watts 和 steven strogatz 在《自然》杂志上发表了里程碑式的文章《collective dynamics of “small-world” networks》,该文章正式提出了小世界网络的概念并建立了小世界模型。
小世界现象在在线社交网络中得到了很好地验证,根据2011年 facebook 数据分析小组的报告, facebook 约7.2亿用户中任意两个用户间的平均路径长度仅为4.74,而这一指标在推特中为4.67。可以说,在五步之内,任何两个网络上的个体都可以互相连接。
无标度特性:大多数真实的大规模社交网络都存在着大多数节点有少量边,少数节点有大量边的特点,其网络缺乏一个统一的衡量尺度而呈现出异质性,我们将这种节点度分布不存在有限衡量分布范围的性质称为无标度。无标度网络表现出来的度分布特征为幂律分布,这就是此类网络的无标度特性。
1.3 网络模型
ws 模型:ws 模型即小世界模型,通过小世界模型生成的小世界网络是从规则网络向随机网络过渡的中间形态。
ba 模型:ba模型考虑到现实网络中节点的幂律分布特性,生成无标度网络。
其他模型:森林火灾模型,kronecker 模型,生产模型。
2. 虚拟社区(社团)及发现技术
2.1 定义
虚拟社区基于子图局部性的定义:社区结构是复杂网络节点集合的若干子集,每个子集内部的节点之间的连接相对非常紧密,而不同子集节点之间的连边相对稀疏。
在社交网络中发现虚拟社区有助于理解网络拓扑结构特点,揭示复杂系统内在功能特性,理解社区内个体关系。为信息检索、信息推荐、信息传播控制和公共事件管控提供有力支撑。虚拟社区发现存在着许多经典的算法,这些算法用于挖掘不同规模的虚拟社区,算法在追求高精度的同时力求提高效率(降低时间复杂度)。
2.2 社区发现算法评价指标
以下评价指标可通过搜索引擎获得详细的介绍:
模块度(modularity):通过比较现有网络与基准网络在相同社区划分下的连接密度差来衡量网络社区的优劣。
nmi (normalized mutual information):利用信息熵来衡量预测社区结构一直社区结构的差异,该值越大,则说明社区结构划分越好,最大值为1时,说明算法划分出的社区结构和一直社区结构一致,算法效果最好。
rand index:表示在两个划分中都属于同一社区或者都属于不同社区的节点对的数量的比值。
jaccard index:jaccard 系数用来衡量样本之间的差异性,是经典的衡量指标。
2.3 社区静态发现算法
模块度最优化算法
mark newman 提出了针对模块度的最大化的贪心算法fn。可参考文献:newman,mark ej. “fast algorithm for detecting community structure innetworks.” physical review e 69.6 (2004): 066133.
多目标优化算法
zhao, yuxin, et al. “acellular learning automata based algorithm for detecting community structure incomplex networks.” neurocomputing 151 (2015): 1216-1226.
du, jingfei, jianyang lai,and chuan shi. “multi-objective optimization for overlapping communitydetection.” international conference on advanced data mining andapplications. springer, berlin, heidelberg, 2013.
基于概率模型的算法
newman, mark ej, andelizabeth a. leicht. “mixture models and exploratory analysis innetworks.” proceedings of the national academy of sciences104.23(2007): 9564-9569.
ren,wei, et al. “simple probabilistic algorithm for detecting communitystructure.” physical review e 79.3 (2009): 036111.
信息编码算法
rosvall, martin, and carl t.bergstrom. “maps of random walks on complex networks reveal communitystructure.” proceedings of the national academy of sciences 105.4(2008): 1118-1123.
kim, youngdo, and hawoongjeong. “map equation for link communities.” physical review e 84.2(2011): 026110.
2.4 社区动态发现算法
派系过滤算法
palla, gergely, et al.“uncovering the overlapping community structure of complex networks innature and society.” arxiv preprint physics/0506133(2005).
kumpula,jussi m., et al. “sequential algorithm for fast cliquepercolation.” physical review e 78.2 (2008): 026109.
基于相似度的聚合算法
shen, huawei, et al.“detect overlapping and hierarchical community structure innetworks.” physica a: statistical mechanics and its applications388.8(2009): 1706-1712.
huang,jianbin, et al. “density-based shrinkage for revealing hierarchical andoverlapping community structure in networks.” physica a:statistical mechanics and its applications 390.11 (2011): 2160-2171.
标签传播算法
raghavan, usha nandini, rékaalbert, and soundar kumara. “near linear time algorithm to detectcommunity structures in large-scale networks.” physical review e 76.3(2007): 036106.
gregory, steve. “finding overlapping communitiesin networks by label propagation.” new journal of physics 12.10(2010): 103018.
局部扩展优化算法
lancichinetti, andrea, andsanto fortunato. “benchmarks for testing community detection algorithms ondirected and weighted graphs with overlapping communities.” physicalreview e 80.1 (2009): 016118.
lee,conrad, et al. “detecting highly overlapping community structure by greedyclique expansion.” arxiv preprint arxiv:1002.1827 (2010).
3. 虚拟社区演化分析
在线社交网络中存在着大量显性或者隐性的虚拟社区结构,这些虚拟社区结构并不是永恒不变的,随着事件变化,社区结构也在不断演变。分析动态的虚拟社区结构演化有助于理解整个社交网络的演化过程,所以有着重要的研究价值。
3.1 虚拟社区的涌现
虚拟社区涌现即在社交网络中虚拟社区从无到有的过程,其最重要的特征是网络聚集现象。
周期闭包:所谓周期闭包,是指网络节点倾向于和自己在网络中邻居的邻居建立连接关系而形成的结构,该机制是导致虚拟社区形成的主要因素。实验表明三元闭包的出现概率随着两个节点之间测地距离的增减呈指数递减。相反地,焦点闭包和测地距离无关,其生成原因是两个节点之间有共同的兴趣或参与共同的活动。
偏好连接:在很多真实网络中,新增加的边并不是随机连接的,而是倾向于和具有较大度数的连接。
3.2 虚拟社区的演化
在线社交网络虚拟社区演化过程非常复杂,影响因素很多。如何挖掘虚拟社区演化中的关键性因素成为社交网络研究中一个重要而有挑战性的课题, 用户个体的累积效应、结构多样性和结构平衡性三个基本因素对虚拟社区演化都存在影响。
3.3 演化虚拟社区的发现
演化虚拟社区发现目前已有大量的研究资料,以下五种是比较成熟的算法模型,具体细节和根据参考文献进一步了解。
基于相邻时刻相似度直接比较的演化虚拟社区发现
hopcroft, john, et al.“tracking evolving communities in large linked networks.” proceedingsof the national academy of sciences 101.suppl 1 (2004): 5249-5253.
greene, derek, donal doyle, and padraigcunningham. “tracking the evolution of communities in dynamic socialnetworks.” advances in social networks analysis and mining (asonam), 2010international conference on. ieee, 2010.
基于演化聚类分析的演化虚拟社区发现
chakrabarti, deepayan, ravi kumar,and andrew tomkins. “evolutionary clustering.” proceedings ofthe 12th acm sigkdd international conference on knowledge discovery and datamining. acm, 2006.
lin, yu-ru, et al.“facetnet: a framework for analyzing communities and their evolutions indynamic networks.” proceedings of the 17th international conference onworld wide web. acm, 2008.
基于拉普拉斯动力学方法的演化虚拟社区发现
lambiotte, renaud, j-c.delvenne, and mauricio barahona. “laplacian dynamics and multiscalemodular structure in networks.” arxiv preprint arxiv:0812.1770 (2008).
基于派系过滤算法的演化虚拟社区发现
palla, gergely, albert-laszlobarabasi, and tamas vicsek. “quantifying social groupevolution.” nature 446.arxiv: 0704.0744 (2007): 664.
基于节点行为趋势分析的演化虚拟社区发现
hopcroft, john, et al.“tracking evolving communities in large linked networks.” proceedingsof the national academy of sciences 101.suppl 1 (2004): 5249-5253.
二. 社交网络群体行为形成与互动规律
1. 用户行为分析
社交网络用户行为是用户对自身需求,社会影响和社交网络技术进行综合评估的基础上做出的使用社交网络服务的意愿,以及由此引起的各种使用活动的总和。用户行为是在线社交网络研究的重要内容。现有研究主要基于如下两种思路展开,一是将在线社交网络作为一种特定的信息技术,研究用户对在线社交网络技术的采纳行为、拒绝行为和用户忠诚;二是将在线社交网络视为提供各种服务和应用的平台,研究用户使用各种服务和应用所表现出的特征与规律。
1.1 用户采纳与忠诚
在线社交网络用户采纳是指用户在对自身需求、社会影响和在线社交网络技术进行综合评估的基础上做出的使用在线社交网络服务的意愿或行为,在线社交网络再出现初期能否被尽可能多的用户采纳和试用对于其后续的扩散至关重要。目前已有多种理论被用于揭示在线社交网络用户采纳行为机理。其中,技术接受模型和计划行为理论是研究者们应用最多的两种理论。
在线社交网络用户忠诚是指用户在使用社交网络服务之后,能够继续保持使用的习惯。各种层出不穷的新型网络服务所带来的竞争压力让保持在线社交网络用户忠诚度愈发困难。目前为止,已经有多种理论被用于在线社交网络的用户忠诚研究。其中,期望确认理论和心流体验理论受到较多研究者青睐。
基于技术接受模型的在线社交网络用户采纳模型
david fred 提出技术接受模型是目前信息系统研究领域最经典的模型之一。对模型详细了解可参考:
davis, fred d. “perceived usefulness, perceived ease of use, and user acceptance of information technology.” mis quarterly (1989): 319-340.
基于计划行为理论的在线社交网络用户采纳模型
icek ajzen 提出的计划行为理论已经被广泛用于人类行为研究。对理论详细了解可参考:
ajzen, icek. “from intentions to actions: a theory of planned behavior.” action control. springer berlin heidelberg, 1985. 11-39.
基于期望确认理论的在线社交网络用户忠诚模型
由 oliver 提出的期望确认理论是研究消费者满意度的基本理论。 anol bhattacherjee 再该理论的基础上结合信息系统的特点提出了信息系统持续使用的期望确认模型(ecm-isc)。对模型详细了解可参考:
bhattacherjee, anol. “understanding information systems continuance: an expectation-confirmation model.” mis quarterly (2001): 351-370.
基于心流体验理论的在线社交网络用户忠诚模型
mihaly csikszentmihalyi等提出的心流体验理论是目前关于用户体验研究的重要理论。对理论详细了解可参考:csikszentmihalyi, mihaly. beyond boredom and anxiety. jossey-bass, 2000.
1.2 用户个体使用行为
一般使用行为:用户可以在社交网络上执行各种各样的行为,例如浏览,点击,分享,点赞,收藏等等。具体的分类可参考:benevenuto f, rodrigues t, cha m, almeida v. characterizing user behavior in online social networks. new york, new york, usa: acm; 2009:49-62. doi:10.1145/1644893.1644900.
内容创建行为:用户在社交网络通过写博客微博,发帖评论等行为产生内容,对内容创建行为的研究主要研究创建内容的动机、创建内容时的主题选择偏好以及内容创建时的语言表述等。关于主题,可通过搜索引擎搜索 lda 模型。
内容消费行为:用户在社交网络中通过浏览,分享和评论来满足他们的社交需求,对社交网络内容的消费可分为主动消费和被动消费。被动消费即“浏览”,有研究表明,社交网络中高达92%的行为都是浏览行为。主动消费即社交搜索,例如搜索朋友的信息以及向社交圈内好友提问等等。
1.3 用户群体互动行为
群体互动关系选择:对群体互动关系的研究主要是识别用户之间的关系,通过制定不同的衡量指标,研究用户之间的关系强弱。
群体互动的内容选择:社交网络中用户对内容选择与其社交关系密不可分。例如有研究表明两位维基百科编辑在互动前后产生的编辑内容的相似性有所不同。
群体互动的时间规律:在线社交网络中人类行为的时间特征研究主要集中于分析行为发生的时间间隔分布。研究发现在线社交网络中用户行为时间间隔分布不同于传统的负指数分布,而是呈现幂律分布,即具有“长尾效应”。对群体互动时间规律的研究可以应用到公共管理和决策等场景中。
2. 社交网络情感分析
随着互联网技术的迅速发展,网络已经成为人们获取信息,发表意见的主要途径,根据文本内容,我们可以将网络中的文本分为两种,一种是客观描述信息,主要针对事件、产品等进行客观描述,另一种是主观性信息,主要产生与用户对人物、事件、产品进行客观性描述;另一种是主观性信息,主要产生于用户对人物、事件、产品等的评价信息。主观性信息表达了人们的各种情感色彩和情感倾向,如“支持”、“反对”、“中立”等。
情感分析,在此等同于意见挖掘,是针对主观性信息进行分析、处理和归纳过程。情感分析最初起源于自然语言处理领域,主要从语法语义规则方面对文本的情感倾向性进行研判。随着社交网络的兴起与发展,情感分析逐渐涉及多个研究领域,如文本挖掘、web 数据挖掘等,并延伸至管理学及社会科学等学科,并在产品评论、舆情监控、信息预测等多个领域发挥着重要的作用。
2.1 文本情感分析技术
基于语义规则的情感分析技术:我们将一句话中的带有感情的形容词和副词提取出来构成一个情感词典,这些词语可以代表用户的某种倾向性。基于语义规则的分析技术是计算评价词和情感词典中已经标注倾向性词语的距离,从而达到情感分类的目的。其最经典的算法是 so-pmi 算法。
基于监督学习的情感分析方法:基于监督学习的方法是首先通过人工标注文本的情感极性,然后将此作为训练集,通过机器学习的方法对目标文本进行情感分类。常用方法:朴素贝叶斯,支持向量机。
基于话题模型的情感分析技术:有两个话题模型,plsa (probabilistic latent semantic analysis)和 lda (latent dirichlet allocation) 模型,网络上有大量的学习资料可供读者进一步了解。
2.2 社交网络情感分析技术
面向短文本的情感分析技术:社交网络产生大量的短文本,例如微博和新闻评论,论坛帖子等等,这些短文本不同于新闻报道,其语法不规则,充斥大量噪声,因此对短文本的分析非常重要。
基于群体智能的情感分析技术:用户在社交网络中表达意见会受到其社交关系的影响,情感会沿着社交关系进行传播,因此可以通过研究社交用户之间的关系来提高情感分析的准确度。
社交网络的垃圾意见挖掘技术:社交网络中的垃圾意见,包括水军与广告等信息,通过对垃圾意见的挖掘,能够有效区分有效信息和垃圾信息,从而提高社交网络使用体验。
3. 个体影响力分析
发现社交网络中的有影响力的个体是社交网络研究中非常重要的研究分支,而且其有着重要的应用价值。例如微博营销,谣言检测,舆情管理等等。
3.1 基于网络结构的个体影响力计算
基于社交网络的图结构特性,有几个指标用来衡量网络中节点的中心度,即节点的影响力。除了以下三种外还有 pagerank 中心度等度量方法。
度中心度(degree centrality):度中心度是指与该节点直接相连的节点的数量。
接近中心度 (closeness centrality):指某节点与网络中所有其他节点的最短距离之和。
介数 (betweenness centrality):介数用来衡量某节点在社交网络中中介作用大小。网络中某两个节点所有最短路径的数量除以这些路径中经过 a 节点路径的数量便是 a 节点的介数,也叫中间中心度。
3.2 基于行为的个体影响力计算
社交网络中用户的行为决定用户的影响力,以微博为例,用户主要表现的行为是评论、转发、回复、点赞、复制、阅读等等,基于这些行为特征构建多种网络关系图,可通过随机游走等方法发现网络中的影响力个体。
3.3 基于话题的个体影响力计算
在社交网络中用户在不同话题下的影响力不同,可以根据用户的关注网络和用户兴趣相似性来计算用户在每个话题上的影响力。
4. 群体聚集及影响机制分析
本部分主要介绍群体极化的概念。群体极化是指在群体决策的情境中,个体意见或决定往往会受到群体间的彼此讨论的影响,而产生一个群体性的结果。群体极化往往表现为群体内的个体不经过个人思考而同意大多数人的观点。群体极化是一个社会心理学概念,在社会学名著《乌合之众》中提到的大众心理状态就是群体极化的体现。
群体极化产生的条件可概括为四点:第一,必须有激发事件出现;第二,群体内的个人能看到前人的选择;第三,群体信息缺乏;第四,群体有一定的同质性。
在在线社交网络分析中,人们通过建立分析模型和仿真来研究在线社交网络中的群体极化现象。主要的分析模型有基于博弈论和委托—代理理论的从众行为模型,基于信息瀑的群体一致性模型和基于元胞自动机群决策和行为仿真。
twitter 中政治观点的极化[4]
三. 社交网络信息传播与演化机理
1. 在线社交网络信息检索
信息检索(information retrieval) 是从大规模非结构化数据中获取信息的过程,例如搜索引擎就是典型的信息检索技术的应用。在线社交网络数据结构有其特殊性,以微博的“话题”(#话题名称#)为例,这种新型的信息组织方式是传统信息检索研究没有涉及的,所以对社交网络信息的检索成为了一门研究课题。
1.1 社交网络内容搜索
内容搜索是指给定查询,从大量信息中返回相关信息的过程。例如在微博上搜索相关热点事件名称,能够返回关于热点事件的微博。内容搜索是信息检索最经典的应用形式。经典的信息检索模型有向量空间模型(vsm),概率模型及 bm25检索公式,基于统计建模检索模型及查询拟然模型,基于统计语言建模的检索模型等。
针对微博的内容检索建模,目前有两种主要的方法:
时间先验方法:时间先验是由于语料库中的文档具有不同的重要性,考虑语料库背景定义不同的计算公式,再将计算结果用于检索模型以期得到更好的检索效果的一种检索方法。目前考虑时间信息计算文档先验的研究工作可分为两种:一种定义文档的时间变化关系;另一种为修改 pagerank 的方法,在其中加入时间关系。具体细节可参考:
li, xiaoyan, and w. bruce croft. “time-based language models.” proceedings of the twelfth international conference on information and knowledge management. acm, 2003.
yu, philip s., xin li, and bing liu. “on the temporal dimension of search.” proceedings of the 13th international world wide web conference on alternate track papers & posters. acm, 2004.
多特征组合的方法:多特征组合方法是通过组合多个微博特性来检索微博内容。下面的参考文献中提到的微博特性有:微博个数,关注数,粉丝数,微博长度,微博是否含有外链。具体细节可参考:
li, nagmoti, rinkesh, ankur teredesai, and martine de cock. “ranking approaches for microblog search.” web intelligence and intelligent agent technology (wi-iat), 2010 ieee/wic/acm international conference on. vol. 1. ieee, 2010.
1.2 社交网络内容分类
面向文本的分类称为文本分类。分类包括训练和测试两阶段,简单地说,训练是根据已标注类别的语料来学习分类规则或规律的过程。而测试是将已训练好的分类器用于新文本的过程。不管是训练还是测试,都需要将分类对象进行特征表示,然后利用分类算法进行学习或者分类。以下社交网络中内容主题分类的相关参考文献,读者可自行查阅。
liu, zitao, et al. “short text feature selection for micro-blog mining.” computational intelligence and software engineering (cise), 2010 international conference on. ieee, 2010.
yuan, quan, gao cong, and nadia magnenat thalmann. “enhancing naive bayes with various smoothing methods for short text classification.” proceedings of the 21st international conference on world wide web. acm, 2012.
ling, xiao, et al. “can chinese web pages be classified with english data source?.” proceedings of the 17th international conference on world wide web. acm, 2008.
zhang, dan, et al. “transfer latent semantic learning: microblog mining with less supervision.” aaai. 2011.
1.3 社交网络推荐
协同过滤推荐:传统的协同过滤根据用户(user)和物品(item)信息构建矩阵,根本的原则是相似用户的选择也相似,例如 a 和 b 都喜欢 m,其中 a 还喜欢 n,那么 b 也有可能喜欢 m。在社会化协同过滤推荐中,我们可以利用用户之间的社交关系,弥补协同过滤矩阵中缺失的内容,从而使协同过滤的结果更加精准。
基于模型的推荐:
邻居模型:
ma, hao, et al. “sorec: social recommendation using probabilistic matrix factorization.” proceedings of the 17th acm conference on information and knowledge management. acm, 2008.
矩阵分解模型:
funk, simon. “netflix update: try this at home.” (2006).
融入社交网络信息:
jamali, mohsen, and martin ester. “a matrix factorization technique with trust propagation for recommendation in social networks.” proceedings of the fourth acm conference on recommender systems. acm, 2010.
2. 社交网络信息传播规律
信息传播是人们通过符号、信号、传递、接收与反馈信息的活动,是人们彼此交换意见、思想、情感,已达到互相了解和影响的过程。社交网络信息传播是指以社交网络为媒介进行信息传播的过程。研究社交网络信息传播的规律,有助于我们加深对社交系统的认识,理解社交现象。也有助于模式发现,大影响力节点识别和个性化推荐。下面主要介绍几种社交网络信息传播模型。
2.1 基于网络结构的传播模型
线性阈值模型( linear threshold):
granovetter, mark. “threshold models of collective behavior.” american journal of sociology 83.6 (1978): 1420-1443.
独立级联模型( independent cascade):
goldenberg, jacob, barak libai, and eitan muller. “talk of the network: a complex systems look at the underlying process of word-of-mouth.” marketing letters 12.3 (2001): 211-223.
2.2 基于群体状态的传播模型
传染病模型(si, sis, sir), 传染病模型是经典的信息传播模型,网上有丰富的参考资料。
线性影响力模型( linear influence model):
yang, jaewon, and jure leskovec. “modeling information diffusion in implicit networks.” data mining (icdm), 2010 ieee 10th international conference on. ieee, 2010.
2.3 基于信息特性的传播模型
在线社交网络中的信息承载着用户网上活动的所有记录,在信息传播分析时起着不可或缺的重要作用。信息本身也具有一些特性,例如时效性,主体多样性,多源触发,信息合作与竞争等。依据这些特征,可建立不同的模型。
myers, seth a., chenguang zhu, and jure leskovec. “information diffusion and external influence in networks.” proceedings of the 18th acm sigkdd international conference on knowledge discovery and data mining. acm, 2012.
beutel, alex, et al. “interacting viruses in networks: can both survive?.” proceedings of the 18th acm sigkdd international conference on knowledge discovery and data mining. acm, 2012.
此外,对社交网络信息传播规律的研究还包括热度预测和信息溯源。感兴趣的读者可自行查阅了解。
3. 话题发现与演化
在话题发现和演化的大部分研究中,话题是指一个引起关注的事件或活动,及其所有相关事件和活动。其中,事件或者活动是指在一个特定的时间和地点,发生的一些事情。社交网络语料库中的数据和传统话题发现语料库的数据区别较大,所以我们必须使用新的方法或对传统方法进行改进来适应社交网络数据特点。
一般社交网络例如 twitter 的数据有以下特点:数据规模大、内容简短、噪声多、数据特征丰富等。下面介绍几种主要的话题发现和演化模型。
3.1 基于主题模型的话题发现
最具有代表性的主题发现模型——lda
blei, david m., andrew y. ng, and michael i. jordan. “latent dirichlet allocation.” journal of machine learning research 3.jan (2003): 993-1022.
3.2 基于向量空间模型的话题发现
salton, gerard, anita wong, and chung-shu yang. “a vector space model for automatic indexing.” communications of the acm 18.11 (1975): 613-620.
becker, hila, mor naaman, and luis gravano. “beyond trending topics: real-world event identification on twitter.” icwsm 11.2011 (2011): 438-441.
3.3 基于词项关系图的话题发现
词项共现是自然语言处理技术在信息检索中的成功应用之一。它的核心思想是词项之间的共现频率在某种程度上反映了词项的语义关联。最初学者们利用词项共现来计算文档的相似性,随后学者们利用该方法来完成话题词提取,话题句提取和摘要生成任务。
sayyadi, hassan, matthew hurst, and alexey maykov. “event detection and tracking in social streams.” icwsm. 2009.
3.4 基于主题模型的话题演化
yin, zhijun, et al. “lpta: a probabilistic model for latent periodic topic analysis.” data mining (icdm), 2011 ieee 11th international conference on. ieee, 2011.
wang, xiaolong, chengxiang zhai, and dan roth. “understanding evolution of research themes: a probabilistic generative model for citations.” proceedings of the 19th acm sigkdd international conference on knowledge discovery and data mining. acm, 2013.
3.5 基于相邻时间片关联的话题演化
lin, cindy xide, et al. “the joint inference of topic diffusion and evolution in social communities.” data mining (icdm), 2011 ieee 11th international conference on. ieee, 2011.
saha, ankan, and vikas sindhwani. “learning evolving and emerging topics in social media: a dynamic nmf approach with temporal regularization.” proceedings of the fifth acm international conference on web search and data mining. acm, 2012.
4. 影响力最大化
影响力最大化是在社交网络中选定信息初始传播用户,使得信息的传播范围能达到最大,即影响力最大。影响力最大化算法的目的就是找出一定数量的用户作为影响力传播的初始节点。对影响力最大化的问题的建模是基于社交网络信息传播模型的。其中最经典的模型是线性阈值和独立级联模型。
影响力最大化算法被证明为 np-hard问题,下面主要介绍两种典型的影响力最大化算法。
4.1 贪心算法
贪心算法从单个节点开始,计算每选一个新节点作为初始节点对每个节点带来的边际收益,取能造成边际收益最大的点加入初始节点集合。贪心算法的缺点是计算时间成本较大,但是计算精度较高。
kempe, david, jon kleinberg, and éva tardos. “maximizing the spread of influence through a social network.” proceedings of the ninth acm sigkdd international conference on knowledge discovery and data mining. acm, 2003.
chen, wei, yajun wang, and siyu yang. “efficient influence maximization in social networks.” proceedings of the 15th acm sigkdd international conference on knowledge discovery and data mining. acm, 2009.
4.2 启发式算法
不同于贪心算法选择任何一个点作为初始节点开始计算,启发式算法先通过一定策略选取一定数量的初始节点,然后计算其影响力传播。其优点是速度快,缺点是精度低。
chen, wei, yajun wang, and siyu yang. “efficient influence maximization in social networks.” proceedings of the 15th acm sigkdd international conference on knowledge discovery and data mining. acm, 2009.
chen, wei, yifei yuan, and li zhang. “scalable influence maximization in social networks under the linear threshold model.” data mining (icdm), 2010 ieee 10th international conference on. ieee, 2010.
四. 社交网络分析的应用
1. 社交推荐
社交推荐顾名思义是利用社交网络或者结合社交行为的推荐,具体表现为推荐 qq 好友,微博根据好友关系推荐内容等。在线推荐系统最早被亚马逊用来推荐商品,如今,推荐系统在互联网已无处不在,目前大热的概念“流量分发是互联网第一入口”,支撑这个概念有两点核心,其一是内容,另外就是推荐,今日头条在短短几年间的迅速崛起便是最好的证明。
根据推荐系统推荐原理,社交推荐可定义为一种“协同过滤”推荐,即不依赖于用户的个人行为,而是结合用户的好友关系进行推荐。对于互联网上的每一个用户,通过其社交账户能很快定义这个用户众多特点,再加之社交网络用户数之多,使得利用社交关系的推荐近些年备受关注。
人们更愿意接受来自朋友的推荐,来源:尼尔森
笔者所了解到的研究有,根据不同社交网络之间进行信息信息匹配进而进行推荐,有根据社交关系解决新注册用户的冷启动问题等。总之社交推荐在内容分发、广告宣传等领域有着十分重要的地位。具体应用细节大家可以关注笔者的一篇介绍腾讯社交广告的文章( mp.weixin.qq /s/ mlpnomdbpdaeb5izb_a3rg),如果想了解这方面更多信息还可以关注推荐系统领域顶级会议 acm recsys。
2. 舆情分析
舆情分析在互联网出现之前就被广泛应用在政府公共管理,商业竞争情报搜集等领域。在社交媒体出现之前,舆情分析主要是线下的报纸,还有线上门户网站的新闻稿件,这些信息的特点是相对专业准确,而且易于分析和管理;但随着社交媒体出现,舆情事件第一策源地已经不是人民日报新华社这样的大媒体,而是某一个名不见经传的微博用户,一个个人微信公众号。他们的特点是信息非常新鲜,缺点是真实度较低且传播十分迅速,难以控制。所以在社交网络下的舆情分析是一门新的学问。
“刺死辱母者”微博转发趋势,来源见水印
举几个例子,去年的和颐酒店,今年的北京地铁骂人事件这类急性舆情事件最早就是在微博上爆出,而且在短时间内迅速传播。还有去年的关于快手的“中国农村残酷底层物语”,今年的“北京房价”等这类民生话题,也是在微信公众号逐渐发酵。
当然,在新形势下的舆情应对,也已经有新的工具,大家百度“舆情分析平台”或者“舆情分析软件”可以找出一大堆。比较有名的有蚁坊、红麦、清博、知微、新榜等等。一些传统的舆情分析机构开始转型做“大数据”的舆情分析,也有近年来完全基于社交媒体的舆情平台,比如基于微信的新榜和基于微博的知微 。除此之外,bat 等大型平台有自己舆情分析工具,可以私人订制,也有开放的指数(百度指数、微信指数)。
3. 隐私保护
隐私问题在互联网时代已经是老生常谈的问题了。在社交网络中,作为用户,我们可能会留下大量痕迹,这些痕迹有隐性的,也有显性的,好不夸张地,社交服务提供商可以根据你的少量痕迹,挖掘到大量你的个人信息,有些信息是你不愿意别人知道的。
这其中存在一个矛盾,即社交服务提供商处于商业目的想尽可能获取你的个人信息,但是你又担心自己的个人信息被泄露。所以在隐私保护领域,一方面要设计足够安全的机制,技术层面的,法律层面的,在保护个人隐私的前提下最大化商业利益和用户的体验。
“云端”的隐私,来源: s9.sinaimg
举一个大家比较熟悉的例子,即许多网站注册账户的时候使用微信、支付宝账户验证,即免去了大家填写个人信息的烦恼,又保护了大家的隐私。同理,蚂蚁金服提供的芝麻信用功能也有隐私保护的功能。
目前学界对隐私保护的研究主要还是从技术层面设计完善的隐私保护机制。
4. 用户画像
一种用户画像流程,来源: 51callcenter
用户画像,这是个营销术语,即通过研究用户的资料和行为,将其划分为不同的类型,进而采取不同的营销策略。传统的用户画像最常用的手段就是调查问卷,订阅过杂志和报纸的读者都知道,会有各种各样的有奖问卷,一方面用来获得对于产品的反馈,另一方面就是对你进行画像,这些画像资料甚至广泛在黑市流通,这就是你为什么有时候会接到莫名其妙的电话的原因(又扯到了隐私保护问题)。
在社交网络,用户画像方式变得更多了,除了传统的线下问卷变成在线问卷。我们通过用户的行为,一方面通过统计学方法获得一些用户特征(经典的例子是沃尔玛的“啤酒和尿布”,另一方面通过机器学习进行建模和验证获得意外的收获(参见上面提到的腾讯社交广告文章)。
接触过微信公众号后台的读者都知道,公众号后台对微信公众号文章的读者还有公众号粉丝的画像已经做得非常充足了,好像微博会员也有粉丝画像的功能。这些便捷的功能对于媒体运营者和广告投放者都有非常重要的作用。
5. 谣言检测
谣言检测算是舆情分析的一部分,之所以单独提出来是因为这部分非常重要,而且谣言的确定对于舆情管理非常重要。早起微博因为充斥着大量谣言,使得新浪微博不得不推出“微博辟谣”官方账号,到如今微博以及有许多自发和官方的辟谣账号,微信公众号也是如此。
“六小龄童春晚被拒”谣言传播走势,来源见水印
传统辟谣方法无非是进行试试检验,用证据说话,随着现在机器学习技术的迅速发展,我们也可以通过信息传播的轨迹,信息内容等维度自动判断消息是否属于谣言,而且判断地越迅速,对于舆情管理的意义就越大。同理,这种技术也被应用在社交网络有害信息识别。
在国外,有关 facebook 假新闻的新闻被炒得火热,有兴趣的读者可以关注一下。
6. 可视化
可视化是随着大数据一起成为热门话题的。因为人类对于图像信息的理解速度要大于文字信息数百倍,所以讲一些数据可视化有助于人们更生动地理解某一结论或现象。当然不是所有数据都适合可视化,在社交网络中,我们最常见的有信息传播轨迹还有词云图等。有关这方面的内容可以参考微博账号“社交网络与数据挖掘”。
微博明星好友关系可视化,来源见水印
除了专门可视化的机构,网上也有许多开源的可视化库,百度的 echarts 就很有名。 对于社交网络信息传播以及好友关系等的可视化,使得我们能直观看到一些事实,这对于舆情报告制作以及新闻报道都有很好的辅助作用。
五. 社交网络前沿研究
我在本部分搜集了几篇近两年来在社交网络顶级会议上比较受关注的文章,将文章的摘要翻译并陈列,以供各位读者参考。
1. negative link prediction in social media
tang, jiliang, et al. “negative link prediction in social media.” proceedings of the eighth acm international conference on web search and data mining. acm, 2015
近年来,符号网络(signed network)越来越受到关注。对于符号网络的研究表明,负关系(negative link)对分析过程有帮助。由于许多网络中用户无法指定这种负关系,这是其被有效利用的主要障碍。话句话说,负关系的重要性与其在真实数据集之间的应用存在着差距。因此,我们自然而然会探讨是否能通过公开的社交网络数据自动预测用户的负关系。在本文中,我们研究了在社交媒体中仅仅用正关系和内容为中心的交互行为(content-centric interactions)来预测负关系的问题。我们对负关系做了一些列观测并且提出了一个原则性框架 nelp,该框架可以利用正关系和以内容为中心的交互来预测负关系。我们对在现实社交网络的实验结果表明,nelp框架可以准确地预测具有正关系和以内容为中心的交互关系的负关系。 我们的详细实验还说明了各种因素对nelp框架有效性的重要性。
2. twitter sentiment analysis with deep convolutional neural networks
severyn, aliaksei, and alessandro moschitti. “twitter sentiment analysis with deep convolutional neural networks.” proceedings of the 38th international acm sigir conference on research and development in information retrieval. acm, 2015
本文介绍了我们用于推特舆情分析的深度学习系统。我们工作主要的贡献是提出了一个初始化卷积神经网络参数权重的模型,这对于准确训练模型至关重要,同时避免增加新的特征。简而言之,我们用无监督神经语言模型来训练初始的词嵌入(initial word embeddings),这个词嵌入将被通过我们的基于远程监督语料库(distant supervised corpus)的深度学习模型进一步调整。在最后阶段,预先训练的参数将被用于初始化我们的模型,然后我们通过由semeval-2015组织的twitter情绪分析官方系统评价竞赛最近提供的监督训练集对后者进行培训。我们的方法得到的结果和参与竞赛的系统的结果之间的比较表明,我们的模型可以分别排在短语级别子任务a(11个团队)和消息级子任务b(40个团队)前两位。这证明了我们8797威尼斯老品牌的解决方案的实际价值。
3. social recommendation with strong and weak ties
wang, xin, et al. “social recommendation with strong and weak ties.” proceedings of the 25th acm international on conference on information and knowledge management. acm, 2016
随着在线社交网络的爆炸式增长,现在人们普遍了解,社会信息对推荐系统非常有帮助。社会推荐方法能够应对关键的冷启动问题,从而可以大大提高预测精度。主要的原因是,基于信任和影响,人们对其朋友购买过的产品表现出更多的兴趣。尽管在社交推荐领域已经有大量工作,但是很少有人关注社交强关系和弱关系这两个重要的社会学概念之间的区别。在这篇文章中,我们使用邻域重叠来逼近关系强度,并扩展受欢迎的贝叶斯个性化排名(bpr)模型并将其用于区别强弱关系。我们提出了一种基于 em (em-based)的算法,它可以根据最优推荐准确度(optimal recommendation accuracy)对强弱关系进行分类并学习所有用户和所有商品的潜在特征向量(latent feature vectors)。我们对四个现实世界数据集进行广泛的实验,并证明我们提出的方法在各种精度指标中显著优于目前最好的成对排名(pairwise ranking)方法。
4. online actions with offline impact: how online social networks influence online and offline user behavior
althoff, tim, p. jindal, and j. leskovec. “online actions with offline impact: how online social networks influence online and offline user behavior.” tenth acm international conference on web search and data mining acm, 2016:537-546
如今许多应用软件都广泛地利用了社交网络功能并允许用户互相连接、互相关注、分享内容和评价动态。尽管这些功能已经被广泛应用,对于用户在线时和离线后参与还是保留的行为却很少有人理解。本文中,我们通过一个运动记录 app研究了社交网络是如何影响用户线下行为的。
我们分析了600万用户五年间的七亿九千一百万条线上和威尼斯人2299的线下活动记录,结果表明社交网络对用户线上和线下的行为有着巨大的影响。具体来讲,我们提出了社交网络影响用户行为的因果关系。我们发现新社交关系的建立能将用户在 app 中的活跃度提高30%,用户保留率提高17%,线下活跃率提高7%(大约每天多走400步)。通过开展自然实验,我们将新社交关系对用户的影响和用户因为对 app 的兴趣而走更多步数作了区分。
我们发现社交影响占所有对用户行为影响因素的55%,剩下的45%可以用用户对 app 本身的兴趣来解释。此外我们还发现一连串的个人用户之间的社交关系建立对每日步数的增加有显著影响,用户之间每增加一条边都对会减弱这种影响,并且这些变化是基于边属性和用户自己的资料属性。最后我们用这些现象设计了一个模型,模型用来判断哪些用户最容易被新建立的社交网络关系影响。
5. intertwined viral marketing in social networks
zhang, jiawei, et al. “intertwined viral marketing in social networks.” advances in social networks analysis and mining (asonam), 2016 ieee/acm international conference on. ieee, 2016
传统的病毒式营销问题旨在为一个单一产品选择一个种子用户的子集,以最大限度地提高其在社交网络中的知名度。而然在实际情况下,许多产品可以同时在社交网络中进行推广。从产品层面来看,这些产品之间的关系是互相缠绕的,举个例子,就是竞争、互补且独立的关系。
在这篇文章中,我们将研究“纠缠影响力最大化”问题,它是基于一个目标产品需要在社交网络上进行宣传,而同时有多个竞争/互补/独立的产品在推广这样的场景。纠缠影响力最大化是一个非常具有挑战性的问题,首先是因为很少有模型能模拟多种产品同时宣传时的信息扩散形式;第二是对于目标产品最优种子集的选择可能很大程度上取决于其它产品的营销策略。为了解决此问题,我们提出了一种统一贪心算法框架(intertwined influence estimator, tier),在四种不同类型现实社交网络数据集的实验表明tier 优于所有的比较方法,在解决纠缠影响力最大化问题上有着显著优势。
6. who to invite next? predicting invitees ofsocial groups
yu han, and jie tang. "who to invite next?predicting invitees of social groups " proceedings of thetwenty-sixth international joint conference on artificial intelligence (ijcai-17).2017.
whatsapp、snapchat 和微信等社交即时通讯工具很大程度上改变了人们工作生活和交流的方式,也受到了多个领域例如计算机科学、心理学、社会学和物理学的关注。在社交即时消息工具中,社交群组在多用户交流中扮演着重要的角色。一个有趣的问题是,社交群组动态演变的机制是什么?更具体来说,在一个群组中,谁将会被邀请加入?这篇文章中,我们研究社交群组潜在加入者这样一个新颖的问题。我们采用微信这个中国最大的社交软件作为实验数据的来源。我们提出了一个概率图模型用来计算影响用户被邀请加入群组概率的因子。我们的实验预测结果表明我们的模型相比目前的其他模型有显著的提高。
7. the co-evolution model for social networkevolving and opinion migration
gu,yupeng, yizhou sun, and jianxi gao. “the co-evolution model for socialnetwork evolving and opinion migration.” proceedings of the 23rd acmsigkdd international conference on knowledge discovery and data mining.acm, 2017.
几乎所有的真实社交网络都是动态且随着时间演化的。新的链路的形成和旧的链路的消失很大程度上取决于社交网络用户的同质性。同时,一些社交网络用户的隐性性质例如用户的观点也随着时间而变化。其中一部分原因是用户从社交网络中接收到影响力,这些改变进而会影响社交网络的结构。社交网络的演化和节点性质的迁移通常被认为是两个独立正交的问题。
在这篇文章中,我们提出一种协演化模型,通过对两种现象的建模形成闭环。模型有两个主要部分:
一个已知节点性质的网络生成模型;
一个已知社交网络结构的节点性质迁移模型。
通过模拟发现我们的模型有一些不错的特性:
它可以模拟一个大范围现象,例如观点的收敛和基于社群的观点差异;
它可以通过一系列因子例如社交影响力范围,意见领袖,噪声等级来控制网络的演化。
最后,我们模型的有效性通过在对议会立法议案支持者的预测中得到了验证,并且我们的模型优于一些目前的方法。
六. 学习资料
1. 图书
《社会计算》lei tang, huan liu
《社交网站的数据挖掘与分析》matthew a. russell
《在线社交网络分析》 方滨兴等
《社交媒体挖掘》huan liu等
《大话社交网络》郎为民
2. 网站
大数据导航(此网站包含很多资源)
hao.199it /
斯坦福数据集网站(jure 男神)
memetracker.org/data/index.html
加州大学欧文分校数据集网站
archive.ics.uci.edu/ml/datasets.html
国内社交网络数据集共享网站
socialysis.org/data/project/project
清华大学搭建的学术数据库
cn.aminer.org/
亚马逊商品流行趋势分析平台
132.239.95.211:8080/demowww/index.jsp#
明尼苏达双城分校社会计算实验室
grouplens.org/
新华网信息传播影响力评估
xinhuanet /xuanzhi/zt/xzyxl/index.html
新榜,微信公众号数据检测平台
newrank /
清博新媒体大数据平台
gsdata /
百度echarts数据可视化库
echarts.baidu /
阿里云 datav 数据可视化库
yq.aliyun /teams/8
3. 工具
python 及其相关库(scipy,numpy,pandas,scikit,scrapy,twitter )更多请见 blog.csdn /hmy1106/article/details/45166261
图分析分析工具 graphchi,snap,pajek,echarts
可视化工具gephi,graphviz
数据挖掘工具 weka,alphaminer
图数据库neo4j
4. 会议
笔者仅列出与社交网络相关的部分国际会议,排名不分先后,加粗的会议为专门讨论社交网络话题的会议。
kdd, www, icdm, cikm, aaai, sdm, ieee bigdata, asonam, wsdm,icwsm, acl, ijcai, nips, icml, ecml-pkdd, vldb, sigir, pakdd, recsys, acm ht, sbp, icwe, pydata
笔者在这里推荐两个国内的社交网络分析会议,一个是全国社会媒体处理大会(smp),由中国中文信息学会主办,会议论文 ei 检索。第二个是国际网络空间数据科学会(ieee icdsc),会议由中科院,北大,中国网络空间安全协会等机构筹办。
5. 课程
笔者在上一部分提到的国际会议,例如 www、kdd 等,每年都有关于社交网络分析方向的 tutorial,其视频和 ptt 都是在网上可获取的,通过 tutorial 能对相关领域有一个宏观了解并且能了解领域前沿动态。
除此之外,在 coursera 上面密西根大学安娜堡分校开设的一系列 python 学习课程也值得一看。在网易公开课上面也有中文的 python 数据挖掘课程可供学习。
万能的淘宝也提供大量廉价的视频和电子学习资料。
最后,利用好科学上网工具和搜索引擎(不是百度)才是王道。
?
在短短几年里驰骋于强手如林的网络市场,而且,崛起得如此神速。这说明了什么?
?面书(facebook)和推特(twitter)究竟靠什么在这么短时间取得如此骄人的业绩?
附录1:
成立时间:2004年2月4日;所属行业:互联网;所在地区:美国 加利佛尼亚州;主营业务:社交网络服务。
公司地址:加州 帕拉图 斯坦福 研究 工业园
facebook(非官方中文名称:脸书、面书或非试不可、非死不可)是一个社交网路服务网站,于2004年2月4日上线。
?
从2006年9月到2007年9月间,该网站在全美网站中的排名由第60名上升至第7名。
app.tech.ifeng /enterprise/index.php?name=facebook
?
附录2:
产品全称:twitter;发布时间:2006年;所属公司:obvious;价格区间:免费;消费人群:网民。
twitter即近期相当火爆的微博客服务的典型应用,是一个可让你播报短消息给你的朋友或“followers(跟随者)”的在线服务,
?
它也同样可允许你指定哪个你想跟随的twitter用户,这样你可以在一个页面上就能读取他们发布的信息。
?
app.tech.ifeng /product/index.php?name=twitter
twitter的五种可能盈利模式
tech.ifeng /internet/detail_2010_03/30/439996_0.shtml
?
附录3:
?
facebook?vs?twitter ?-?[?翻译此页?]
13 jan 2009 –?should you choose between ?
facebook and twitter?
twitip /twitter-versus-facebook/?-?网页快照?-?
facebook(非官方中文名称:脸书、面书或非试不可、非死不可)是一个社交网路服务网站,于2004年2月4日上线。从2006年9月到2007年9月间,该网站在全美网站中的排名由第60名上升至第7名。同时facebook是美国排名第一的照片分享站点,每天上载八百五十万张照片。据报道,facebook首席执行官马克·扎克伯格(mark zuckerberg)6月25日在法国表示,facebook的活跃用户数量将在明年某个时候达到10亿人。随着用户数量增加,facebook的目标已经指向另外一个领域:互联网搜索。
产品功能
墙(the wall)
墙就是用户档案页上的留言板。有权浏览某一个用户完整档案页的其他用户,都可以看到该用户的墙。用户墙上的留言还会用feed输出。很多用户通过他们朋友的墙,留短信儿。更私秘的交流则通过“消息(messages)”进行。消息发送到用户的个人信箱,就象电子邮件,只有收信人和发信人可以看到。
2007年7月起,用户可以在墙上贴附件。之前,只允许文本内容。
礼物(gift)
2007年2月,facebook新增了“礼物”功能。朋友们可以互送“礼物”一些由前苹果设计师susankare设计的有趣的小图标。礼物从facebook的虚拟礼品店选择,赠送时附上一条消息。收到的礼物以及所附的消息会显示在收礼en乳腺癌基金会。之后,facebook每天推出一款新礼物,大多数都是限量版,或只是限期供应。用户个人有facebook用户都可以使用这个功能。目前是免费的。
捅(pokes)
facebook提供一个“捅(poke)”别的用户的功能,让用户可以给别人发送一个“poke”。facebook常见问题中这样解释:“poke是你和朋友互动的一种方式。当我们设计这个功能时,我们觉得提供这么一个什么意思也没有的功能其实
另有一些衍生出来的新功能,如“x 我”,和“超级poke”,让用户可以把poke替换成任何动作。
状态(status)
状态,让用户向他们的朋友和facebook社区显示他们现在在哪里、做什么。facebook让用户填入状态的提示是“(某某用户)正在。。。”,用户填入剩下的部分。在用户好友列表的“新近更新”区,显示这些状态。
活动(events)
facebook活动的功能帮助用户通知朋友们将发生的活动,帮助用户组织线下的社交活动。
第三方应用
开放平台
2007年5月24日,facebook推出facebook 开放平台(facebook platform)——把自己的api(应用编程接口)向公司外的第三方软件开发者开放,允许第三方开发者将开发的产品和应用在facebook平台上推广。facebook平台下的有很多优秀的apps实用工具,大量的第三方工具极大扩展了facebook的功能和应用,给facebook带来了巨大的成功。
在facebook内部有一个特殊区域,在这里用户能够浏览和安装第三方应用。因此正如arrington所说:“api允许第三方使用绝大多数网络上经常使用的应用重新创建facebook照片收藏夹。然后用户就可以删除默认的facebookphotos软件,然后安装第三方应用软件取而代之。”一旦用户加入了新的应用,就会在档案页面中以选项形式出现,以facebook方式,就是在他们的新闻群中进行了宣布,于是好友中的人都会收到通知,被告知他已经安装了应用。
常见应用
在facebook海量的实用工具中,我挑选了几个优秀的应用(apps)推荐给大家,安装后会令大家的facebook功能得到很大的增强,以下是这些应用程序清单和介绍:
windows live messenger
微软提供的msn工具,使用此工具可以将用户messenger的个人消息更新到facebook状态消息。启用该工具后,无论用户在何时更新messenger个人消息,用户的facebook个人消息将相应更新。
hesine
和信开发的facebook手机端应用,能够即时接收facebook好友的更新信息,也能从手机直接回复或发布新的图片和文字到facebook,实际操作像收发短/彩信一样简单。这个应用无需登陆wap网站,没有任何的短/彩信费用,也非常节省流量。
twitter官方页面推荐的实用工具,可以将twitter发布的信息同步到facebook的应用程序,也可以在facebook发布信息到twitter上。同步速度非常快,twitter发布的瞬间即可同步到facebook,成为连接两大社会化网络的有力工具。
friendfeed
friendfeed集成到facebook中的实用工具,不过里面部分信息会和facebook本身抓取的内容重复。
支持的信息更新到facebook,可以支持同时更新twitter、plurk、tumblr、gtalk、blogger等很多个社会化服务。
zoho online office
可以将zoho文档、表格、幻灯片演示和数据库导入到facebook中。在facebook上进行文档的编辑处理工作。
todo list
一个不错的时间管理工具,可以方便的添加任务,具有邮件提醒功能。
facebook toolbar for firefox
facebook工具栏是一个firefox扩展,具有搜索、联系朋友、获取消息、分享内容等功能,直接在工具栏上即可操作。
liveupload to facebook
集成了windows live照片库,可以在windows live photo gallery中批量上传照片到facebook上,非常方便和快捷。这也是windows live photo gallery的一个很实用的插件。
其他流行的应用:
顶级朋友:用户可以选择和显示他们最好的朋友。
涂鸦板:一个图形效果的“墙”。
我喜欢:一个社会化音乐发现和分享服务,包括音乐会信息和有关音乐知识的小游戏,甚至有象棋、拼字游戏之类的游戏出现。
第三方网站如进行facebook应用数据统计的adonomics,相关博客如apprate、inside facebook、face reviews等等或应运而生或对facebook应用青眼有加。
网站对用户是免费的,其收入来自于广告。广告包括横幅广告和由商家赞助的小组(2006年4月,有消息称facebook每周的收入超过一百五十万美 元)。用户建立自己的档案页,其?
中包括照片和个人兴趣;用户之间可以进行公开或私下留言;用户还可以加入其他朋友的小组。用户详细的个人信息只有同一个社交网络(如学校或公司)的用户或被认证了的朋友才可以查看。
据techcrunch(译者:硅谷最著名的it新闻博客。)报道,“在facebook覆盖的所有学校中,85%的学生有facebook档案;(所有这些加入facebook的学生中)60%每天都登陆facebook,85%至少每周登陆一次,93%至少每个月一次。”据facebooke 发言人chrishughes说,“用户平均每天在facebook上花19分钟。”据新泽西州一家专门进行大学市场调研的公司“学生监听”在2006年进行的调研显示,facebook在“本科生认为最in的事”中排名第二,仅次于苹果的ipod,和啤酒与性并列。
2007年7月4日,altura 风投宣布“altura 1 facebook投资基金”,成为第一个只投资facebook相关项目的风险投资。
2007年7月10日,bay partners宣布成立“应用工厂(appfactory)”,一个只投资facebook应用的种子基金。
2007年8月29日,facebook改变了他们对应用程序热度的衡量标准,更倾斜于那些有深度价值的应用。因为之前,衡量 标准仅以用户数为标准,使得那些高度“病毒传播”(译者:指极易于在用户间口口相传)但没什么用处的程序排名很高。著名it博客valleywag曾批评 facebook 应用是“一大堆垃圾”。
截止2007年9月26日,共有超过4500个facebook应用出现。
2009年3月6日,facebook发布了一项新功能,用户将可以在facebook的所有第三方应用里直接使用facebook chat聊天功能。这将大大增加第三方应用的使用率。
2009年5月30日,有业内人士透露,facebook应用平台盈利能力惊人,开发商年收入可达过亿美元。今年,位于旧金山的休闲游戏开发商zynga有望通过在facebook和其他网站销售虚拟礼物获得九位数(上亿美元)的收入。专门通过facebook为品牌广告商研发应用的buddy media首席执行官迈克·拉泽洛(mike lazerow)表示,公司在09年的收入有望实现300%的增长,实现八位数的收入(上千万美元)。
facebook标识语言(facebook markup language)
facebook 标识语言是html的子集。facebook应用的开发者可以用这种语言定制他们的应用程序的外观。
facebook视频
与facebook开放平台同时推出的,还有一个facebook自己开发的应用程序--视频分享。用户可以上传视频、通过 “facebook移动”上传手机视频,以及用摄像头录像。同时用户可以给视频中的朋友加“标签”。这一功能被认为会与myspace的相关功能竞争。但 facebook的视频只能在facebook网络内观看。然而,一段发表在userscripts上的greasemonkey代码让用户可以 下载facebook视频或将之转贴在其他网站。
facebook的域模型
用uml类图的形式,显示了facebook系统所管理的信息。它提炼出了facebook数据库中的实体、关系、字段。
比如,图中显示了有关工作、学校、信用卡、显示用户名等的字段。(×××方框代表类)
请注意该图为概念类图,而不是具体实施的细节。如欲了解更多数据模型的细节,请参考facebook查询语言(fql)一种类似sql的查询语言的相关资料。
技术构架
facebook使用lamp(linux、 apache、 mysql、 php)作为技术构架。facebook的一个技术构架工程师steven yoosure在博客中写到:
几乎我们所有的服务器都运行开源软件。我们的web服务器是linux,apache和php。我们数据库是mysql。我们 使用memcached来保证网站的快速反应。一些后台应用python、perl和java,以及一些gcc和boost。程序员用 subversion和git来进行代码管理。还有很多--象很多网站一样,从头到脚都是开源软件。
facebook的源代码大部分采用common public attribution license (cpal),除了fbml parser部分采用的是mozilla public license (mpl)。
访问:facebook open platform
facebook现有超过24000个应用,世界各地有超过40万开发者在为其开发应用程序,每天都有140个左右的应用上线。
facebook的创办人是mark zuckerberg,他是哈佛大学的学生,之前毕业于ardsley高中。最初,网站的?
注册仅限于哈佛学院的学生。在随後的两个月内,注册扩展至波士顿地区的其他高校(如麻省理工学院)以及斯坦福大学、纽约大学、西北大学和所有的常春藤名校。第二年,很多其他学校也被邀请加入进来。最终,在全球范围内有一个大学后缀电子邮箱的人(如.edu, 等)都可以注册。之后,在facebook中也可以建立起高中和公司的社会化网路。而从2006年9月11日起,任何用户输入有效电子邮件位址和自己的年龄段,即可加入。用户可以选择加入一个或以上网路,例如中学的、公司的、或地区的。
根据2007年7月的数据,facebook在所有以服务於大学生为主要业务的网站中,拥有最多的用户:3400万活跃用户(包括在非大学网路中的用户) 。由2006年9月至2007年9月间,该网站在全美网站中的排名由第60名上升至第7名。同时facebook是美国排名第一的照片分享站点,每天上载850万张照片。这甚至超过其他专门照片分享站点,如flickr。
网站的名字facebook来自传统的纸质「花名册」。通常美国的大学和预科学校把这种印有学校社区所有成员的「花名册」发放给新入学或入职的学生和教职员,协助大家认识学校内其他成员。
2005
2005年5月,facebook获得accelpartners的一千两百七十万美元风险投资。2005年8月23日,facebook从aboutface公司手中以20万美元购得域名,从此从名字中把the去掉了。网站当时进行了重大改进。据zuckerberg称,目的是提高用户档案页面的用户友好性。在这个月,mccollum回哈佛大学继续学业,同时仍旧以顾问的身份继续为facebook工作,并在暑假来公司工作。hughes则继续在剑桥市(译者:哈佛大学所在地)履行他公司发言人的职责。2005年9月2日,zuckerberg推出了facebook高中版,并称这是最合乎逻辑的下一步。虽然最初,这被定位为需要邀请才能加入的社区,仅15天以后,大部分高中的网络不需要密码也可以加入了(虽然facebook账户还是需要的)。到10月份,facebook已经扩展到大部分美国和加拿大的规模更小的大学和学院。除此之外,还扩展到英国的21所大学、墨西哥的itesm、波多黎各大学、及维京群岛大学。2005年12月11日,澳大利亚和新西兰的大学也加入了facebook,至此,facebook中共有超过2000所大学和高中。
2006
2006年2月27日,应用户要求,facebook允许大学生把高中生加为他们的朋友。约一个月后,2006年3月28日,《新闻周刊》报道facebook可能被收购,谈判正在进行中。据报道,facebook拒绝了一个七亿五千万美金的收购条件,甚至有传闻收购价格达到了20亿美金。同年四月,peter thiel、greylock partners和meritech capitalpartners额外投资了两千五百万美元。5月,facebook扩展到印度的印度理工学院和印度管理学院。6月,facebook状告quizsender抄袭其设计风格,要求赔偿十万美元。7月25日,facebook增加了更多提高收入机会的功能。和苹果itunes的合作推广活动中,加入“苹果学生小组”的用户可以在9月10日之前每周下载25首单曲。这个推广活动的目的是让学生们在秋季学期开学前对苹果和facebook的服务都更熟悉和喜爱。8月,facebook又加入了德国的大学和以色列的高中。8月22日,facebook推出facebook记事本功能一个可以加标签、嵌入图片、评论的博客服务。同时用户可以从其他博客服务中导入。2006年9月11日,facebook对所有互联网用户开放,这引起了很多现有用户的抗议。但两周后,facebook注册仍旧对所有拥有有效电子邮件地址的人开放。
2007
2007年5月10日,facebook宣布了一个提供免费分类广告的计划,直接和其他分类广告站点,如craigslist竞争。这个被称为“facebook市场”的功能,于2007年5月14日上线。2007年5月24日,facebook推出应用编程接口(api)。通过这个api,第三方软件开发者可以开发在facebook网站运行的应用程序。这被称为facebook开放平台(facebookplatform)。同年6月,和itunes的合作继续为用户提供免费音乐单曲下载。7月,facebook完成了第一次对其他公司的收购,从blake ross和joehewitt手中收购了parakey(译者:ross和hewitt是火狐浏览器的作者,parakey是一个被称为网络操作系统的平台)。7月24日,facebook聘用youtube的前cfo gideon yu为cfo,替换了michaelsheridan。8月,facebook成为新闻周刊的封面故事。
2007年9月25日,微软宣布他们可能会收购facebook的部分股份。据称facebook被完全收购可能性不大,因为其创
始人mark zuckerberg希望保持独立。
2008
根据comscore咨询公司的数据显示,2008年5月facebook全球独立访问用户首次超过了竞争对手myspace,前者五月独立访问用户达到了1.239亿,页面浏览量达到500.6亿,而后者独立访问量为1.146亿次,页面浏览量为450.4亿,但facebook流量增长主要来自海外,而在美国myspace的独立访问用户数量仍然领先于facebook,myspace在美国的独立访问用户数量为7307万,而facebook独立访问用户数量为3506万;6月,facebook推出简体中文版本,该页面由志愿者用户免费翻译而成,向中文用户开放,同时facebook还向中国香港和中国台湾用户推出繁体中文版本。
2009
美国网络流量调查单位compete所公布的数据显示,facebook一月的美国国内用户访问数达到6850万,比起对手myspace的5850万高出将近20%;而据facebook ceo马克·扎克博格(markzuckerberg)在官方博客上宣称,一月该网站的全球用户人数已达1.5亿,其中近一半每天都在使用facebook,扎克博格称,facebook的用户人数已经覆盖全球各大洲,甚至包括南极洲。他戏称:“如果facebook是一个国家,则将是世界上人口第八多的国家,略多于日本、俄罗斯和尼日利亚。”
2009年8月10日,facebook宣布收购web服务公司friendfeed,继续向用户提供和好友分享和互联的最好工具。
2010
2010年2月2日, 据国外媒体报道,facebook正赶超雅虎将成为全球第三大网站,与微软谷歌领衔前三。据悉,facebook去年取代aol成为世界第四大网站。但comscore数据显示,其月独立访问人次和当时排名第三的网站雅虎相比,还相差2.41亿。到2009年12月,这个差距就缩小到1.25亿人次。(同月,facebook在美国国内替代了原排名第四的aol。)
2009年12月,facebook的独立人次达到了4.69亿,与上月相比整整增加了3100万人次。facebook一个月内增加的新用户量相当于雅虎一年所增加的用户量,也相当于digg总用户量和twitter的用户量的一半。同时,雅虎从11月到12月流失700万独立访问用户,年末其独立访问人次已经降到了5.94亿。(在美国,雅虎排名第二,仅次于谷歌。雅虎12月份的独立访问用户为1.61亿人次,谷歌为1.73亿人次,微软为1.38亿人次,facebook为1.12亿人次)
这个数字和facebook的3.5亿注册用户不一样,这些用户中有一半的人每天都会访问网站。comscore统计了网站每天的访问量,结果是比注册用户的人数还多。不过 ,这些数字都只是估计的,还不包括每月6000万通过facebook网站链接登陆到其他网站的用户人数。
以年计算,2009年facebook独立访问用户增长了2.5亿人次。2010年想要维持这样的增长速度比较困难,但是,就算保持09年增长速度的一半,facebook仍然稳操胜券,能够在一年以内超过雅虎成为世界第三大网站,而且还不用上市。当然,要超过排名第二的微软和名列榜首的谷歌,还需要很长一段时间。微软09年末的世界独立访问用户达到了7.27亿人次,于上年相比增加了8000万人次,而谷歌达到了8.99亿人次,与上年相比增加了1.23亿人次。
其他方面的数据,facebook也已经超过雅虎和微软。其综合浏览量增长了141个百分点,在09年末达到了1930亿,几乎是雅虎和微软的两倍(雅虎减少2个百分点,为1000亿,微软增长54个百分点为1090亿)。谷歌综合浏览量仍然名列榜首,每月的访问量达2740亿(增加了35个百分点)。很明显,雅虎失去了竞争力。微软和谷歌至少还保持着可观的增长速度。但是人们也不难想象facebook有一天总会超过谷歌。
facebook在用户在网站停留的时长上也超过了雅虎(1.16亿和1.01亿),同样的,其用户在网站停留的平均时长也超过了雅虎(facebook为每月274分钟)。
市场调查公司compete的统计表明,今年一月份facebook的独立ip访问量为1.34亿,而yahoo的则为1.32亿,facebook已经超越yahoo成为美国第二大网站,仅次于位于第一的google。曾几何时,yahoo曾经是互联网的旗帜,即2008年2月其访问量被google超越之后,现在它又失去了第二的宝座。而facebook的上位,也说明了社交网站巨大实力和发展前景。人们对互联网的使用已经从单纯的工具发展到了生活必需品。
不过在这个统计中,yahoo旗下的delicious和flickr的访问并没有统计在内(这些网站没有统一在yahoo的域名下),而facebook的所有的服务都在facebook的域名之下。但facebook拥有更高的用户参与度,用户平均有11%的上网时间花了facebook上,而yahoo和google这一数据仅为4%。
创始人: mark zuckerberg 马克·扎克伯格
创始人
公司: facebook 脸谱网
成立日期: 2004年2月4日
资产结构: 由 peter thiel and accel合伙人共同成立
雇员: 32个在帕拉阿图,4个在波士顿
总部: 帕拉阿图
马克·扎克伯格简介:
从外表上看,26岁的美国人马克·扎克伯格和刚刚走出校园的普通年轻人没什么不同。他穿简单的t恤、松垮的牛仔裤、阿迪达斯运动鞋,讲起话来甚至有点腼腆。四年前,扎克伯格还是一名默默无闻的辍学生,而现在他已经成为互联网界炙手可热的人物。作为社区网站facebook的掌门人,《福布斯》日前评选出十位最年轻的亿万富翁,26岁的马克-扎克伯格以69亿美元的身价排在首位,他也因此成为世界上最年轻的亿万富翁。
“盖茨第二”
扎克伯格的人生就像一个电影剧本。他从小就表现出超常的计算机天赋,6年级的时候就开始编程。大学进入众人向往的哈佛,然后又毅然选择退学创业。不到4年的时间,facebook已经发展成为当今互联网的一个奇迹。目前它的用户数量已经突破3.5亿,而它的市值估计也已经高达300亿美元。
这个年轻的美国小伙子被人称为“盖茨第二”。的确,他的人生和微软公司创始人比尔·盖茨有着惊人的相似之处。两人都在19 岁开始创业,同样是哈佛大学的辍学生,同样年纪轻轻就赢得世人的尊敬。
1984年5月,扎克伯格出生于纽约的一个富人区。他的父亲是一名牙医,母亲则是一位精神病医师。他是家里唯一的一个儿子,在4个孩子中排行老二。10 岁的时候,他得到第一台电脑,从此开始了一段奇妙的电脑人生。
扎克伯格自学成才,学会了编程。高中的时候,他为一款mp3播放器设计了插件,这个软件可以识别用户的收听习惯,自动创建符合用户口味的播放列表。扎克伯格把这款软件上传到互联网上供人免费下载,他的才华很快得到了一些大公司的赏识,包括美国在线和微软等大公司都向他抛来橄榄枝。但扎克伯格最终决定以学业为重,于是他来到哈佛。
***生涯
在哈佛,扎克伯格读的是心理学,不过他仍然痴迷于电脑。在最初的那些日子里,扎克伯格就已经表现出创业者所需要的大胆、自信以及能干的特质。
正是在哈佛的宿舍里,扎克伯格写出了facebook的网站程序,他甚至还在这里尝试了一下***生涯。当时哈佛大学不像其他学校那样提供附有学生照片和基本信息的花名册。扎克伯格想为学校建立一个网络版的花名册,但学校以各种理由拒绝提供相关信息。“我只是想证明这事可以办成,”扎克伯格说。于是这位哈佛大一新生在某个夜里***了学校电脑的数据库,获取了里面存储的学生照片。
扎克伯格把这些照片放在他自己设计的网站上,后来这些照片的点击量超过了2.2万次。校方对他的行为非常不满,给了他一个“留校察看”的处分。扎克伯格最后向他的校友表示道歉,尽管他一直认为自己没错。他说:“我只是认为这些信息应该是公开的。”?
“***事件”后不久,扎克伯格与他的两个室友莫斯科维茨和休斯一同创建了facebook网站。他们花了一个星期编写程序,把网站定位为哈佛校友的联系平台。2004年2月,facebook正式对外推出,它立刻横扫哈佛校园。当月底,就有超过半数的哈佛本科生成为它的注册用户。两个月后,facebook的影响力已经遍及所有常春藤院校和其他一些学校。截至2004年底,它的注册人数已经突破了100万。
后来扎克伯格选择从哈佛心理学系退学,专心营运facebook网站。他在2006年接受《福布斯》杂志采访时表示,促使他决定离开哈佛,是比尔·盖茨2004年在哈佛电脑课上的一席讲话。“盖茨鼓励我们利用课余时间从事某个项目,而当时哈佛也允许学生休学创业。当时盖茨开玩笑对我们说‘如果微软失败,我会重返哈佛’。”没有犹豫太久,扎克伯格追随前辈的道路,也离开了校园。
娃娃ceo
2005年春天,扎克伯格为自己的网站争取到了一笔1200万美元的风险投资。签完合同,扎克伯格从硅谷所在的帕洛·阿尔托开车前往伯克利,准备和朋友们庆祝一番。但他却在路上遭遇了人生当中一段惊心动魄的意外。
途中,扎克伯格在一个加油站下车准备给汽车加油。此时一名男子从旁边的树丛里跳出来,手里挥舞着一把枪,嘴里大声囔着什么。“他没说要什么,我想他可能是服用了×××。”随后,扎克伯格退回到车里,毫发无伤地离开了现场。事后回忆起这段经历,他说:“我能活下来真是幸运。”
事实上,这段插曲就像扎克伯格的人生道路一样:前方充满未知,中间有曲折,但结果却好得出乎人的意料。
位于硅谷的facebook总部更像是一间大宿舍。这里工作的400名员工可以免费享用食物和洗衣服务。他们很晚才出现在办公室,但在办公室待得也很晚,如果有派对的话则会走得更晚。
facebook被人称赞为继google之后出现的最伟大创意,但facebook后面的那张年轻得还有些青涩的脸庞让人禁不住要问,这个23岁的年轻人是否足够成熟来驾驭一家公司。《华尔街日报》硅谷专栏作家斯威舍曾把扎克伯格称为“娃娃ceo”。当被问及扎克伯格是不是一个好的ceo时,斯威舍表示:“我不好说。我认为他还很年轻。”
但扎克伯格身边的人都说他很聪明,学东西很快。虽然这位20出头的ceo还穿着帽衫,也许不穿袜子,但他却在成长为一个成熟的企业家。和同龄人不同,23岁的扎克伯格像是一个战略思考者。
不过扎克伯格也会犯错。目前,facebook主要靠广告和赞助盈利。去年,facebook引进了“灯塔”项目,这个项目可以监测用户在购物网站的访问情况,并自动向用户的好友报告。用户们纷纷投诉认为这项功能侵犯了他们的隐私。比如要是有用户在网上给他的妻子买了一枚钻戒想给她意外的惊喜,但由于“灯塔”功能早已将他的这项购物行为传播给了他的亲友,这位用户想要制造惊喜的愿望也就泡了汤。
一开始,扎克伯格对这些抱怨视而不见,直到facebook的3家主要广告商也威胁退出,扎克伯格才做出回应。他发表声明向客户道歉:“在这个功能的建立上,我们犯了很多错误;但在?
我们如何处理问题方面,我们犯的错误更多。”年轻的扎克伯格并不惧怕犯错,他在各种尝试中积累成功的经验。
扎克伯格的性格也影响了整个公司,使其与众不同。在新闻集团2005年以5.8亿美元的价格收购了myspace后,雅虎公司曾出价10亿美元想要收购facebook,但被拒绝。
几乎每个主要的互联网公司都曾试图收购facebook,但扎克伯格一直不为所动。这个年轻人到底在等待什么?有人认为他在等待更诱人的报价,有人则认为这只是他的计划与众不同。对此,他表示:“我只是想建立一个长期的东西。其他事情都不是我关心的。”
直到去年10月,微软公司宣布投资2.4亿美元收购facebook1.6%的股权。按这个价位计算,创建才3年多的facebook市值一举超过150亿美元。至于外界关心的公司何时上市的问题,扎克伯格在日前接受美国广播公司采访时表示,facebook在2008年上市的可能性不大。他说:“不可否认,上市将给facebook带来重大变化。但如果你要问facebook何时上市,我的回答是既可能两年后,也可能是三年后。”
住在小公寓
在大多数同龄人才刚刚迈出大学校园,开始自己的职业生涯时,扎克伯格已经到达了一个别人难以逾越的高度。在接受《时代》周刊采访时,他谈到自己如何看待压力。他说:“我看过对乔布斯(苹果公司总裁)的一次采访,记得他说过这样一句话‘如果你从事了这样的工作并且处于这样的位置,那你就必须非常非常喜欢你的这份工作,否则一切就没意义了’。”
“做facebook这件事情需要付出很多劳动,如果你不把这份工作当回事,或者认为它无足轻重,花这么多时间在它身上实在是不理智。但我却从中能够得到很多乐趣,因为我与一群志同道合的聪明人一起努力,我们来自不同背景,有过不同经历,思考方式也不同,但我们却创造出一个共同的东西。”
尽管身家已经上亿,但扎克伯格的生活仍然普通如同常人。他不买贵的衣服;他有一套一室一厅的小公寓,房间里有一张床垫,他就住在那里。他说自己曾在家里为一个女朋友下过厨,但结果很失败。
扎克伯格这样描述自己一天的生活:“我每天早上醒来,然后走路去上班,因为我住的地方离办公室大概有4个街区。到了办公室,我开始工作,和人见面,整天讨论各种事情。然后我又下班回家睡觉。我没有闹钟。”有传闻说,扎克伯格曾拒绝微软高层提出的约会,原因只是微软把见面时间定在了早上8点,而扎克伯格那会儿还起不了床。
在被问到他的年龄到底是一个优势还是劣势时,扎克伯格说:“可能是利弊兼有吧?我的意思是,像我这样的年龄肯定会缺乏经验和阅历。但也有一些事情是我敢做的,而一些上了年纪的人可能已经不能够敢做敢为。”
facebook是一个社会化网络站点。它于2004年2月4日上线。
facebook的创始人是mark zuckerberg,毕业于phillips exeter academy,并继承了exeter的传统进入了哈佛大学。最初,网站的注册仅限于哈佛学院(译者注:哈佛大学的本科生部)的学生。在之 后的两个月内,注册扩展到波士顿地区的其他高校(波士顿学院 boston college、波士顿大学 boston university、麻省理工学院 mit、特福茨大学 tufts)以及罗切斯特大学 rochester、斯坦福 stanford、纽约大学 nyu、西北大学和所有的常春藤名校。第二年,很多其他学校也被加入进来。最终,在全球范围内有一个大学后缀电子邮箱的人(如 .edu, 等)都可以注册。之后,在facebook中也可以建立起高中和公司的社会化网络。而从2006年9月11日起,任何用户输入有效电子邮件地址和自己的年龄段,即可加入。用户可以选择加入一个或多个网络,比如中学的、公司的、或地区的。
据2007年7月数据,facebook在所有以服务于大学生为主要业务的网站中,拥有最多的用户:三千四百万活跃用户(包括在非大学网络中的用 户)。从2006年9月到2007年9?
月间,该网站在全美网站中的排名由第60名上升至第7名。同时facebook是美国排名第一的照片分享站点,每天 上载八百五十万张照片。这甚至超过其他专门的照片分享站点,如flickr
网站的名字facebook来自传统的纸质“花名册”。通常美国的大学和预科学校把这种印有学校社区所有成员的“花名册”发放给新来的学生和教职员工,帮助大家认识学校的其他成员。
在2008年的年初,facebook 的全球访问量已经超过myspace,成为全球第一大社区网站。
据国外媒体报道,facebook ceo马克·扎克伯格(mark zuckerberg)周五称,该网站明年月活跃用户数将突破10亿大关。 除此之外,facebook还盯上了谷歌搜索广告业务每年250亿美元的收入。4月22日,扎克伯格展示了facebook推出的“喜欢”(like)按钮功能,该功能可以让用户标注自己喜欢的页面,并将这些页面收录至facebook的搜索结果中。这一功能与谷歌利用页面相互之间的链接关系来决定搜索排名类似。
美国科技博客网站allfacebook博客作者尼克·奥尼尔(nick o'neill)认为:“此举标志着facebook正式进军互联网搜索领域,对谷歌展开了全方位的挑战。”facebook coo谢里尔·桑德伯格(sheryl sandberg)6月初透露,除了品牌广告外,搜索广告最终将成为该网站的重要营收来源。
有业内人士称,facebook要实现上述目标任重道远,因为facebook的搜索结果均来源于其用户,与谷歌通过计算机收录的海量搜索结果相比,其质量相差甚远。
截至2010年4月,据comscore的数据显示,谷歌目前是美国最大的网站,覆盖了81%的美国人口,facebook中文网登陆网址
facebookty 覆盖了53%的美国人口,落后于谷歌、雅虎和微软。
而另一家互联网流量监测机构hitwise的数据则不知出于何种缘故,未将雅虎资产进行合并,把雅虎的不同服务单列,其数据显示facebook的访问量在美国网站总访问量中所占比例为7.07%,位居美国第一,其次为谷歌,访问量所占比例为7.03%。雅虎邮箱以3.8%排名第三,雅虎以3.67%位居第四。如果将雅虎邮箱与雅虎网站合并在一起,雅虎将成为访问量最大的网站。视频网站youtube以2.14%的比例位列第五。
2010年4月13日 facebook年内进入中国的消息在业界不胫而走,同时有知情人士透露,facebook正在积极寻找国内威尼斯人2299的合作伙伴,甚至有传出同搜索引擎百度合资的消息。与此同时,facebook进入中国还有诸多悬念。
2010年5月7日,据国外媒体报道,有买家在非公开股票交易市场sharespost上以每股75美元的价格收购facebook股票,对facebook估值高达330亿美元。其他买家希望以每股41美元至61美元的价格收购facebook股票,其中一名买家希望以每股50美元的价格,收购至多50万股facebook股份,对facebook估值为220亿美元。
俄罗斯投资公司dst去年9月宣布对facebook投资2亿美元,对facebook估值为100亿美元。消息人士称,通过在非公开股票交易市场收购员工持有的股票,dst在facebook的持股比例已经由2%提高到10%。
2010年7月12日,据纽约时报的报道,随着facebook入驻印度的消息传开,facebook在印度的注册用户日渐高涨。去年facebook的印度用户仅为google旗下orkut的一半左右,今年以来,facebook的印度整体用户数已经接近orkut了。
1、facebook 最初是靠 paypal 联合创始人彼特·泰尔 (peter thiel) 资助的 50 万美元创办的。
2、公司创办不久,facebook 另一创始人马克·扎克伯格 (mark zuckerberg) 被一家叫 connectu 的公司控告盗窃它的点子和技术,此事后来以赔钱私了了。
3、今天,有 4 亿的用户每个月至少登录一次 facebook,而其中有一半的用户每天都登录。
4、facebook 非常国际化,有 70%的用户来自美国以外的地区,并且它的网站提供超过 70 种不同的语言。丹麦有 500 多万人,其中有一半使用 facebook。
5、facebook 的流量全球第二大,仅次于 google。
6、2006 年,雅虎向扎克伯格提供 10 亿美元,但是被拒绝了;2009 年,facebook 价值 40 亿美元;今天,facebook 身价在 79 亿美元到 110 亿美元之间。
7、facebook 最受欢迎的专页包括 michael jackson、facebook、barack obama 、等等。
8、所有的用户一个月花费 83 个小时在 facebook 上。
9、平均每个 facebook 用户有 130 个朋友。
10、facebook 上活跃的应用程序超过 55 万个,并且不断增加。
11、facebook 大概有 10,000 台服务器,这些服务器大概需要 1 亿美金。
12、在美国,55 岁以上的女性 facebook 用户数量增加最快。
13、facebook 会保存用户的资料,哪怕你的帐号已经停用。事实上,facebook 用户的资料(比如照片)也可以保存在其他用户的个人8797威尼斯老品牌主页上。
14、由于 facebook 是如此的受欢迎,心理学家们发明了一种新的精神病面谱上瘾症。
15、在澳大利亚,facebook 还被用于法院系统。法院通知可以通过 facebook 传达,并且 facebook 传票是合法有效的。
16、facebook 通过广告和虚拟商品盈利。facebook 2007 年的收入为 1 亿 5,000 万美元,2008 年的收入为 3 亿美元,2009 年的收入为 6 亿美元到 7 亿美元之间,2010 年的收入预算为 10 亿美元。
17、2009 年 facebook 上出现最多的关键字有 facebook applications、swine flu、lady gaga、等等。
18、2010年,×××在京发布的《中国新媒体发展报告(2010)》指出,社交网站的病毒式营销手段、泄露个人隐私以及政治、军事、商业机密信息等问题也引发质疑,facebook等社交网站被西方国家情报机构所利用,其特殊的政治功能则让人心生恐惧。
19、2009年的facebook社交游戏是农场和水族馆的天下,2010年对于开发者来讲是策略型游戏开始大行其道的时候。典型的案例是年初的watercooler作品卡米洛特的王国kingdoms of camelot,已经拥有了超过370万的月活跃用户。紧接着其他策略的游戏纷纷登陆facebook平台。
facebook推直播频道
北京时间8月14日消息,据美国科技博客网站inside facebook报道,美国社交网站facebook近日推出了名为“facebook live”的流媒体直播频道,该频道将主要面向facebook用户直播该公司的名人访谈、新产品发布及其他一些特别活动,并鼓励用户与访谈佳宾展开互动交流。
据悉,facebook直播频道允许用户提交问题,并对名人访谈、新产品发布会及其他特别活动发表看法。该直播频道现场在美国加州帕罗奥托市的facebook总部。facebook推出直播频道,也是为了让其全球5亿用户更了解facebook总部每天发生的情况。
facebook live的用户界面非常易于使用,该视频位于网页中心左侧,并显示出当前共有多少用户正在观看该视频流。页面右侧则提供了一些网络工具,以方便用户从事与视频流相关的活动。举例来说,如果某位用户的好友正在观看该视频流,则该用户可与好友就视频流内容展开交流。此外,用户还可向主持人提交问题,或查看其他视频内容。
inside facebook指出,就目前而言,如果用户希望参与facebook live视频流的聊天活动,首先需拥有一个视频流帐号。如此一来,可能导致不少facebook用户参与视频流聊天活动的积极性有所下降。截至目前,facebook直播频道主要内容是对该公司不同员工的采访,但近期内会直播大量有关名人访谈的内容。
大多数中国知名人物均拥有facebook账户,但由于政策法规方面的问题和文化意识方面的冲突,中国政府于2008年开始屏蔽大陆对facebook的访问,目前在华外籍人士、留学生通常通过商业收费×××服务(如a8×××,lava×××)、代理服务、ssh服务等来访问facebook网站。
facebook已超越google成为全球第一大互联网公司。而对于中国这块未开垦的宝地,脸谱网facebook绝对不会“袖手旁观”。脸谱网facebook入华其实只是一个时间上的问题。对于近日有传,腾讯要入股facebook,我觉得这是一件美事,因为二者各遂其所愿。脸谱网可以借助腾讯曲线入华,而腾讯又可借助facebook走向国际。
消息人士称,facebook正由一名来自台湾的人士筹办入华事宜,但此消息难获官方证实。不过或许能够分析出的是,facebook入华与本土互联网巨头之一的腾讯将有千丝万缕的联系。
4月13日凌晨,腾讯发布公告称,将向俄罗斯digital sky technologies limited(下称dst)投资约3亿美元现金,交易完成后,腾讯将持有dst约10.26%的经济权益。腾讯将持有dst约 0.51%的总投票权,并有权提名一名dst董事会观察员。
dst是俄语和东欧市场最大的互联网公司之一,它拥有品牌odnoklassniki和vkontakte等,更值得关注的是,该公司也是facebook的股东之一。
消息称,dst约有facebook 5%的股份,而正是这5%的股份将“facebook”和“腾讯”这两大全球互联网关键词联系起来。
有业内人士表示,“当facebook创始人及ceo马克·扎克伯格愿意接受中国某知名财经杂志采访之时,或许从侧面可以认为这位年轻的带领facebook在流量上超越google的创业家,对中国市场持认可的态度。”
“facebook还未入华,已经来势汹汹。如果与腾讯合作,将避免许多‘本土化’困扰,而腾讯方面,正好可以借机顺利‘国际化’,双方可谓互补互助。”上述人士向cnet记者如此分析。
4月6日,针对腾讯竞购icq一事,首次有媒体联络到腾讯高管,不过其cto熊明华发表了一句耐人寻味的回应:“不方便发表评论”。大胆猜测一番,此话至少没有否定竞购一事的存在。而腾讯现今入股俄罗斯互联网公司dst也是其走向国际化的证明。
洪波认为,腾讯有国际化需求。而业内多数人也认为,facebook有入华意向。由此看来,双方倘若合作,不是偶然!
转载请注明:facebook中文网原文地址:
niub8 /facebook/1.html
转载于: blog.51cto /niub8com/413759