爬取 Plant Cell 期刊创刊到现在发表的 Articles 文章标题和链接,并调用百度翻译API将标题翻译成中文。
使用
首先注册百度翻译帐号,获取API相关信息,然后修改``脚本的第44和45行👇1
2appid = ''
secretKey = ''
修改第227行可选取爬取的起始和终止年限👇1
film = parse_detail_page(1989, 2021, tool)
之后运行python Spider_Plant_Cell.py
即可开始爬取。
结果输出
CSV 文件
1 | 2004 A CDC45 Homolog in Arabidopsis Is Essential for Meiosis, as Shown by RNA Interference–Induced Gene Silencing 如RNA干扰诱导的基因沉默所示,拟南芥CDC45同系物对减数分裂至关重要 http://www.plantcell.org/content/16/1/99 |
标题词云
源码
相关源码位于 Spider_Plant_Cell