你还在为不会FreeStyle而烦恼吗?抓取数据,自制歌词
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者:lidao
主题的思路,就是先抓取很多首歌曲的歌词,利用jieba分词后,将分好的词按照押韵表进行分类,最后匹配查询就可以了
PS:如有需要Python学习资料的小伙伴可以加下方的群去找免费管理员领取
点击加群即可免费获取Python学习资料
可以免费领取源码、项目实战视频、PDF文件等
准备一:押韵表
这个地方可以去网上搜押韵表
准备二:分词对应押韵表编码
分好的词与押韵表对应起来,举个栗子,比如“没有”对应的是“7-13”,就等于你给每个词都贴了一个标签,这样你以后想搜索的时候,就可以根据标签找到这些词了
第一步:爬虫抓取歌词信息
这个地方数据爬取的越多,肯定你的词库就越壮大,后面分词也越高,我这里只爬取了3首歌曲的歌词,并且最后是存储到txt中,当然,放数据库里就更好了
第二步:调用分词的方法
第三步:分析分词后的txt