python常用的读取文件操作
python读取和保存csv、pkl、json、numpy等文件
在上一篇博客中,我们已经搭建了一个Hadoop集群,这里开始学习HDFS的基本原理。
学大数据第一件事就是搭建一个Hadoop集群。这里尝试了两种搭建方式。第一种是使用云服务器搭建。第二种是在虚拟机里面使用Ubuntu18搭建。
最近在做一些信息抽取方面的研究,但是苦于没有中文语料。于是想到了百度百科,从百度百科的词条里的文字,生成一些语料。需要的是非结构化的数据,所以爬取百度百科的描述性的语句,而不是已经结构化的那些标签。
自动生成requirements;
AliCoCo: Alibaba E-commerce Cognitive Concept Net.这是一篇领域知识图谱构建的文章,构建的是电商概念图谱。这篇文章介绍了Alicoco是怎么构建的,以及在电商领域是怎么应用的。