搜索

「谷歌推出数据库搜索引擎Dataset Search,助力科研工作者」9月6日

谈资本人 · 2018-09-06
昨儿,谷歌没有出席美国参议院情报委员会的听证会,也是抢尽了风头~

继Google学术搜索之后,谷歌又一神作——Dataset Search重磅来袭!

还记得曾经的你,在做科研的时候,为了得到一份儿数据集,绞尽脑汁各种百度、各种google,但结果往往一无所获。从今儿起,再也不用担心这个问题了!

数据,可以说是当今世界众多科学家与工作人员赖以生存的一片沃土。而在网络中存在成千上万个数据存储库,科研人员亦可以访问及使用这些数据集。

为了方便科学家和数据相关研究、工作人员能够轻松访问这些数据,谷歌启动了“数据集搜索(Dataset Search)”。与谷歌Scholar工作方式类似,不论数据集是托管、发布在哪个网站、数字图书馆或个人网站,都可以轻松的查找与访问。

然后,谷歌收集并且链接这一信息,对不同版本的同一数据集做分析,并找到描述或讨论数据集的出版物。

谷歌的方法基于一个开放标准(schema.org),任何发布数据的人都可以采用上述方式对他们的数据集做描述。

在这个新版本中,用户可以找到有关环境和社会科学的大多数数据集的引用,以及来自其他学科的数据(包括政府数据和新闻机构提供的数据)。随着越来越多的数据存储库使用schema.org标准来描述它们的数据集,用户在数据集搜索中发现的数据集的多样性和覆盖范围将继续增加。

数据集搜索支持多种语言,当然也包括中文。只需输入你要查找的内容,这款神器便将帮助你在存储库提供者的站点上找到已发布的数据集。

例如,如果你想分析每天的天气记录,你可以在数据集搜索中尝试输入daily weather:

正如搜索结果所示,你可以看到来自NASA、NOAA的数据集,同时也是可以看到来自学术存储库的数据,例如哈佛的Dataverse和ICPSR。

正如NOAA的首席数据官Ed Kearns所说:“这种类型的搜索长期以来一直是科学界许多研究人员的梦想!”

但是谷歌方面也表示,像这样的搜索工具只有在数据发布者愿意提供的元数据的基础上才能发挥作用。并呼吁广大数据提供者能够采用schema.org标准来描述数据。


+1
1

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业