1.5.7 社交网络数据
社交网络数据由三部分组成。第一部分是用户个人资料,由用户的个人属性组成,如性别、家庭住址和年龄。这些信息通常是稀缺和不完整的,因为关心隐私的人不会填写所有信息。这些信息可以帮助进行不同类型的推荐(如广告)。
第二部分是社交结构,以图的形式呈现,表示用户之间的关系、相互依赖或互动。社交结构可以帮助我们检测人群中的社区,理解信息在人群中的传播,甚至预测用户个人资料中的缺失值。
第三部分是用户生成的社交媒体内容,如文本、照片和视频,这些内容含有丰富的关于用户行为/兴趣的信息。当向社交媒体添加位置信息(例如Foursquare的签到数据和带地理标记的推文)时[63],我们可以模拟人们在城市区域内的流动性,这对于城市规划和异常检测是有帮助的[36]。