为什么一个机器学习的时代需要人文

2018年公民并不容易。我们被告知要注意机器人和偏见……

t 2018年公民并不容易。我们被告知要注意机器人和有偏见的搜索引擎,但是对新媒体的怀疑也使我们容易成为老式宣传的牺牲品。唐纳德·特朗普臭名昭著的解释了这种怀疑,批判通过吸引声称大多数新闻来源是假的,”谷歌搜索对他有偏见。

如果民主取决于知情的公民,民主是麻烦了。这是一个许多机构的危机时刻包括高等教育,特别是在英语等学科,哲学,和历史,它承诺为学生作为公民做好准备。让学生为信息被计算机过滤的世界做好准备,我们需要加强人文和数学之间的联盟。这个联盟有两个部分:倒数文化批评的数学模型塑造我们的世界,对文化和数学调查。

传统人文技能仍然很重要,当然:我们仍然需要仔细检查假设和评估论据。但面对21世纪的挑战,公民并不总是参数来评估一个接一个。信息更有可能有瀑布,引导都通过网络的朋友和统计模型,预测我们的偏好。评估来源一个接一个不一定会告诉我们这些计算和社会系统是否给我们一个有偏见的画面。相反,我们需要考虑样品和模型——换句话说,188bet提款关于数学.数学可能曾经似乎是一个专业的科学工具。但在21世纪,文化和政治越来越普遍受到统计推断的自动化形式称为“机器学习。”学生不明白它将难以理解日常生活。

而且很容易误解机器学习。首先,许多关于这个话题的畅销书和文章鼓励读者讨论算法,这是不正确的单词是辩论。一个算法只是一个recipe-a一系列步骤在解决一个问题。”把鸡蛋分开,然后打败白人是一个算法。20世纪以来,关于计算机的谈话深深地受到计算机只能遵循人类指令这一真理的影响,,算法成为一个强有力的时髦词。每当计算机被用来做某事时,记者说它已经完成”通过算法”——可能在技术上是正确的。但创新,允许计算重塑日常生活最近几十年真的不应该被理解为一个大规模的新算法。我们已经朝着一个计算机控制方式不太明确的系统发展。代替手动编写的算法直接控制电脑的决定,我们经常要求计算机通过以下方式编写自己的指令建模要解决的问题。

过滤垃圾邮件的电子邮件,例如,任务定义很差。不受欢迎的电子邮件有许多不同的形状,很难写一个算法,能赶上他们。更灵活的方法通过收集消息的例子,人类读者开始拒绝,随着他们批准的消息。然后我们问电脑写自己的指令,通过观察两组之间的差异。例如,电脑可能会起草一份单词列表中常见的拒绝电子邮件(188bet提款免费的,,提供,,C1LARS),测量的相对概率看到他们在拒绝或接受消息。然后可以使用这个描述spam-this”统计模型”的概念过滤传入的电子邮件。因为这样的词188bet提款免费的提供出现在许多合法的环境中,该模型不会是一个简单的拒绝包含特定单词的消息的流水线算法。188bet提款它,而增加了一系列的证据clues-each分别流向估计邮件是否为垃圾邮件的概率。

浏览

不可见算法,无形政治

劳拉Forlano

而不是电脑给予明确的指示,这种方法,被称为“机器学习,”要求他们掌握在证据中隐含的模糊模式。模式是模糊的,在某种程度上,因为电脑经常从人类行为中学习,不遵循严格的规则。但是需要不精确,更重要的是,从数学学习。学习一门语言,幼儿必须从具体的例子概括(熟悉的虎斑猫)宽松的类别(动物)。这需要一个减法的细节,动物并不总是tabby-colored以来,不要总是咕噜咕噜的,等等。我们可能没有意识到学习需要减法,因为遗忘细节是人类的天性。但是电脑很容易记住细节,如果我们想让他们掌握一般模式,我们必须明确地告诉他们将一长串电子邮件(或动物)压缩成一个有用的模糊模型。机器学习的成功取决于对收集数据和冷凝,但第二个,减法步骤是统计学家所称的部分学习。””

机器学习人类文化越来越形状:我们投票,我们看的节目,这句话我188bet提款们类型在Facebook上成为食物的人类行为模型,反过来塑造我们网上看到的。因为这个周期可以扩大现有的偏见,任何批判的当代文化需要包含一个机器学习的批判。1但是为了让学生为这个新世界做好准备,我们需要做多摇手指,警告他们算法问题。广义怀疑技术并不一定帮助人们理解申辩:总统攻击有偏见的搜索引擎和假新闻最近明确表示。告诉学生要愚弄他们的新技术可以让他们渴望一个简单的治疗所谓的“红色药丸。”(事实上,danah boyd认为,正是试图教会媒介素养往往适得其反。2)适当谨慎,不屈服于偏执狂,学生需要了解的限制和技术的有效应用。人文主义者可以促进这个教育项目的两面,因为我们已经熟悉机器学习的一个重要应用程序的任务建模的模糊,闪光模式隐含在人类行为。这也是一个人文的中心目标。

这听起来可能很奇怪,如果我们相信原型代表数学历史和文学的外星人。但人文主义者总是比原型意味着更灵活:经济历史学家,例如,经常使用数字。文化历史学家还没有过去,因为在20世纪,简单的定量方法并不能真正地解释文化。我们不能编写一个简单的算法来识别一个文学流派,例如,因为大多数类型缺乏清晰的定义。谦逊对这个话题很辛苦赚来的:许多20世纪生活的批评家们花了数年时间试图定义“科幻小说,”在批评者承认这个短语在不同的时间有不同的含义之前。学者们不情愿地放弃了追求统一类型的基本特征,为了承认流派是松散的家庭相似之处,由一系列重叠的特性,和改变他们的意义从一个十年。4

让学生为信息被计算机过滤的世界做好准备,我们需要加强人文和数学之间的联盟。

这种概念听起来可能很模糊,不科学。但机器学习还可以滑和不科学的。5记住,我们采取了机器学习,因为我们不能创造一个简单的,垃圾邮件的通用定义。相反,我们必须利用人类读者拒绝电子邮件的隐性知识的一系列原因。基于这种证据的模型永远不会稳定。它必须更新每隔几年,随着旧骗局的消亡和新骗局的出现。简而言之,最近关于有偏向算法的警告低估了机器学习的真正局限性,这种局限性比任何偶然的偏向都要严重。模型由人类行为的例子必要地模型的一个特定的文化背景。他们永远无法提供永恒的客观性;这不是人类文化提供了什么。

这意味着帮助学生理解历史知识的优点和局限性也可以是帮助他们理解机器学习的优点和局限性的一种方式。事实上,模糊,上下文相关的模型由机器学习有很多共同点和家人相似历史学家在文化。(例如,两种模式都倾向于由许多重叠的线索来定义,不是一个基本特征)所以,它不应该奇怪,机器学习将是有用的文化历史。霍伊特长和理查德·琼也用它来跟踪俳句风格在现代主义诗歌的传播。6凯瑟琳·博德一个虚构的世界比较不同的模型来解释澳大利亚和美国作家分化在19世纪从英国传统。7安德鲁•派珀的枚举甚至用这些方法来梳理见解的特殊的吸引力的windows内向的女英雄。

不是每个学生都需要关心这些具体的例子,但是每个学生需要一些实践经验统计模型新我们的文化中心。和每个学生需要了解这些模型受限于相同语境条件,使历史学家和文学评论家如此谨慎。技术领导人认为,机器学习比其他更客观知识不能信任。但是我们应该强烈不信任政治领导人谁使用互联网的透视的复杂性意味着真正的知识是不可能的,一切都是假的,我们只能依靠亲和力和偏见。通过比较来自不同社会背景的视角,有可能建立真正的知识。历史学家早就知道如何。作为我们了解目前越来越透过统计模型针对特定的目标市场,我们可能需要同样的比较策略来理解我们自己的生活。更根本的是,我们需要意识到历史学家的谨慎和相对主义的传统不是外星人电脑的闪闪发光的新世界。

浏览

社会大局:错误信息

由维克多·皮卡德

这种人文和科学之间的桥梁可能很快具有巨大的重要性。但是大学还没有解释他们的学生。相反,我们通常试图与技术相关的文化变化融入现有的一些纪律。”数字人文,”例如,可以很容易地成为历史和英语部门内部冲突的一个内向的名字。这些冲突教授比学生更重要;学生真正需要的是新的联盟之间的学科。参与者在这样一个联盟不必失去独立的身份,但是他们确实需要握手。学生可能学习如何使用机器学习主要是在定量学科信息科学,或者在新的跨学科领域的科学数据。他们可能转向人文为了新方法应用到文化问题,或为了反映历史和社会影响的方法。

新的学科之间的联系不会取代历史的传统强项,哲学,艺术,和文学,但是,人本主义者和科学家正在共同致力于一个教育项目的新假设仍然代表了一个巨大的变化。20世纪的大部分时间里,这些地区的大学将自己视作(公民)拮抗剂。科学教你怎样克隆T。雷克斯,一个熟悉的海报。人文学科教会你为什么你不应该。这是一个聪明的故事但我们需要超越。真正的怪物在我们的世界不是一个恐龙我们可以避免创建。它是人类历史,已经碎了,贪婪的和难以预测。为了理解它,为了理解我们自己,我们需要数字和词汇。188bet提款人文主义者对造成这一斗争,因为我们比任何人都了解怪物的过去,更了解它的滑溜溜。健康的怀疑数据是我们的一件事,但我们有了更多的怀疑。我们也可以与科学,向学生展示统计推断和历史解读是盟军,生活中相互交织的部分致力于理解。


我给你们留下一些进一步阅读的建议。机器学习不仅是一门新技术,而且是近代思想史上的一个转折点。为了对这种观点进行全书式的探讨,我建议阿德里安·麦肯齐,,机器学习:考古数据实践(2017)。实践经验,最好的地方开始入门课程通常是在“数据科学”8:材料数据,在加州大学伯克利分校,在网上可以找到。也可以学到很多东西从计算和社会科学家们反思自己的领域的历史。狮子座Breiman前几页的“”统计建模:两种文化”给一个好短暂的历史哲学与机器学习的紧张关系。有价值的关键在一篇文章可以找到danah boyd和凯特·克劳福德称为“”大数据的关键问题."机器学习的后果尤其是人文学科仍在散列:咨询工作的脚注在这篇文章中,或自己的新书遥远的地平线(2019)。

这篇文章是由理查德·琼所以.图标

  1. 看,例如,凯茜奥尼尔,,数学毁灭武器:大数据如何增加不平等并威胁民主(王冠,2016)。
  2. 媒体批评和之间的联系”红丸”偏执,看到达纳·博伊德,””你想要媒介素养…你呢?吗?,””点,,3月9日2018.
  3. 约翰·里德,”关于SF的定义,不信:流派理论,SF和历史,””科幻小说研究,卷。37岁的不。2 (2010)。
  4. 泰德·安德伍德,””类型的生命周期,””文化分析杂志,5月23日2016。
  5. 一位著名的机器学习历史学家强调,它的出现是必须的。创建新的认知美德…有时冲突统计精确的一个长久观点。”马修·琼斯,”查询档案:数据挖掘从先验的PageRank,””科学档案:过去,礼物,期货,由洛林编辑Daston(芝加哥大学出版社,2017年),页。311—3。
  6. 霍伊特长和理查德·琼,”现代主义文学模式识别:精读和机器学习,””重要的调查,卷。42岁的不。2(2016)。
  7. 凯瑟琳·波德,一个虚构的世界:数字集合和文学史的未来(密歇根大学出版社,2018年),页。157 - 97。
  8. 安德鲁•派珀,枚举:数据和文学研究(芝加哥大学出版社,2018年),页。138 - 43。
特征图像: 机器人奏鸣曲(2018)。照片由弗兰克V。/ Unsplash