计算传播学导论

第二章 信息与计算

六、通往计算传播学之路

  • 开放数据 (open data)
  • 开放科学(open science)
  • 开源工具(open source):R和Python

方法:从数据到模型

大数据

  • 数字化“指纹”
  • 互联网数据 - D. Watts, A twenty-first century science. Nature 445, 489 (2007).If handled appropriately, data about Internet-based communication and interactivity could revolutionize our understanding of collective human behaviour. 很少有人会认为社会科学会成为21世纪科学的中心 … 因为社会现象是最难解决的科学问题之一 … 社会现象当中卷入了海量的异质性的个体之间的互动 网站记录(Website Logs)与基于互联网的实验(Web-based experiments) 互联网公司与研究者的合作

学科基础

  • 网络科学
  • 计算语言学
    • 机器翻译
    • 语音识别
    • 词云
    • 语义网络
    • 情感分析
    • 文本聚类
    • 主题模型
  • 数据科学

模式或法则

  • 为什么强调模式?
  • P值:统计显著的琐碎

理论模式&数据模式

  • 理论模式:《自杀论》
    • 居住地:城市高于农村
    • 性别:男性高于女性
    • 宗教:新教高于天主教
    • 年龄:老年人多于年轻人
  • 数据模式:幂律

    • 一个涌现的模式背后对应的社会机制
      • 模式或法则:异速增长定律
        • 广义的异速增长
  • 注意力动力学

  • 在线社交网络
  • 选举行为可以通过社交网络传染
  • 手机通话网络
    • 传播的多样性制约社会经济的发展
  • 情感分析
    • 预测股票市场?
      • Emotion
      • Calm
      • Alert
      • Sure
      • Vital
      • Kind
      • Happy
  • The Twitter Political Index
  • 预测总统选举
    • 实际结果
      • Facebook and Twitter
  • Google Flu Trends 使用搜索引擎预测流感

理论的最高标准

Per Bak:“It puzzles me that geophysicists show little interest in underlying principles of their science. Perhaps they take it for granted that the earth is so complicated and messy that no general principles apply”.

Hack定律

Hack定律指出,在河流网络中,支流的长度(stream length)L和相对应的蓄水盆地面积(basin area)A之间存在如下标度关系:L ~ Ah 其中h的数值在大多数水系的实证数据中都被测为0.6左右。

本章讲讨论计算传播学的两个根本概念:信息与计算。今天信息技术(Information Technology, IT)和信息时代的观念已经深入人心。互联网产业的发展进一步促进了人类对于信息技术的迷思。但是,究竟什么才是信息呢?

信息

信息是用来描述各种现象的工具,这些现象涵盖了地震爆发、股市波动、社会运动、日常生活各个方面。信息的传递依赖于媒介作为载体。在传播学当中,传播技术学派的代表人物麦克卢汉更为直接地宣称“媒介即信息”。“媒介即信息”揭示了一个现实,信息在口语中泛指所有表示信息或事实的媒介。

计算

人类计算与机器计算

可计算性

可计算性关注的是计算的基础。

电影《模仿游戏》 ( The Imitation Game,2014)很好的叙述了阿兰-图灵参与破译德军密码的故事。二战期间,盟军苦于德国的秘密系统”英格玛“无法破译,政府召集了一批民间数学家、逻辑学家进行秘密破解工作,图灵就是其中之一。计划刚开始图灵遭到了以休为首的组员和领导的排斥,幸好军情处部长孟席斯帮助他立项研究破译密码的机器,而图灵则变成了负责人,招收了新的成员琼开始了艰难的工作。琼很快就迷上了图灵,由于她的帮助所有组员空前的团结,并于两年后成功破解德军的密码。图灵一度与琼订婚,但实际上他隐瞒了一个秘密,因为这个秘密他也遭受了非人的待遇。

可计算思维

复杂性科学

太阳系、全球气候、世界人口、股票市场、大脑和心脏都是一种动力系统。动力学(dynamics)或者动力系统理论所关注的是如何描述和预测从系统中各个组成部分的群体行为当中涌现出的整体层面的复杂适应行为。

集体智慧