项目作者: XingwXiong
项目描述 :
News Recommendation System
高级语言: Python
项目地址: git://github.com/XingwXiong/NewsRS.git
NewsRS: News Recommendation System
STARTUP
Initialization
$ pip3 install jieba,numpy,pandas,gensim
# or conda install jieba,numpy,pandas,gensim
# or pip3 install -r requirements.txt
# or conda install --yes --file requirements.txt
$ git init
$ git remote add origin git@github.com:XingwXiong/NewsRS.git
$ git pull origin master
$ cd data; tar xzf user_click_data.tar.gz
Classification
data/news_jieba.csv
: pandas.DataFrame 格式, 对数据集中的所有新闻 jieba
分词; data/news_vector.csv
: pandas.DataFrame 格式, 列名为news_id
, 每一列是长度为100
的news向量(news 向量是通过gensim.model.Doc2Vec
得到的);data/usr_vector.csv
: pandas.DataFrame 格式, 列名为usr_id
, 每一列是长度为100
的usr向量(usr 向量是由训练数据中每个用户访问的所有新闻的向量平均值得来的);