他们眼中的日本》汇集了19世纪50年代及之后美国和英国游客对日本的描述。当时,日本已闭关锁国两个多世纪,西方世界对这个刚刚开放的国家充满了好奇。书中的摘录按土地、人物、文化等类别分组,每篇摘录都链接到它在互联网档案馆首次出现的书籍。《他们眼中的日本》可以在线阅读,也可以免费下载电子书。
沉浸式、令人上瘾、商业化,被大量生产和消费
然而,那个时代的许多小说却从文学记忆的缝隙中悄然流逝。“被遗忘的19世纪小说”列出了50部被忽视的小说,它们等待着人们在互联网档案馆中 特殊数据库 发现和免费阅读。过去十年,美国人被鼓吹“学习编程”,以解决一系列根深蒂固的社会问题:科技“技能差距”、人工智能和自动化带来的迫在眉睫的威胁、社会流动性,以及女性和有色人种在科技行业的代表性不足。
为了回应这种普遍的讨论,一个由短期强化培训课程(也称为编程训练营)组成的行业在美国各地兴起,每年带来数亿美元的收入,培训了数万人。编程训练营被塑造成一种旨在解决当代问题的新型机构。然而,互联网档案馆的资料显示,事 您应该了解的印尼在线老虎机代理游戏 实上,70多年前就存在类似的关于计算机编程的讨论,以及类似EDP学校的组织。本次演讲将展示泰德·尼尔森档案馆和《计算机世界》档案馆的资料,以展示过去的经验如何应用于现在。
“生命书目”的愿景是让所有分类学文献公开
以便我们能够找到地球上每个物种的原始描述,并追踪我们对这些物种的认知如何随时间推移而变化。通过将互联网档案馆和 Wayback Machine 的内容与维基数据中的信息相结合,我们可以发现数十万种分类学出版物,其中许多出版物还可以通过互联 2017 年国际理论物理中心会议 网档案馆免费阅读。本次演讲将概述该项目,介绍它与生物多样性遗产图书馆等工作的关联,并重点介绍一些有助于导出这些内容的工具,例如 Wikicite 搜索和 ALEC。
利用社交媒体中用户创建的标签构建语义层级结构
可以为海量数据提供实用的组织结构。然而,由于社交媒体中词汇和标签的语义和语用差异,使用现有的本体(例如 WordNet)构建这些层级结构较为困难。虽然基于标签频率的其他构建方法相对简单,但这些方法容易受到社交媒体动态特性的影响,例如与人气飙升相关的标签。
我们借鉴基于生态学的香农多样性指数 (SDI)
创建了一种更具代表性和弹性的语义层级构建方法,该方法依赖于基于图谱的社群检测和一种新颖的基于熵的集合多样性指数 (EDI) 得分。EDI 量化了每个标签的语境多样性,从而生成数千个语义相关的标签组,这些标签组沿着从一般到具体的频谱进行组织。通过将 EDI 应用于社交媒体数据(Twitter)并将我们的结果与之前的方法进行比较,我们证明了我们的方法能够创建语义一致的层次结构,可以灵活地应用并适应各种用例。