Update readme.md

这个提交包含在:
WENGSYX
2021-06-10 14:43:54 +08:00
提交者 GitHub
父节点 ea575b2e3c
当前提交 f673438b7e

查看文件

@@ -7,7 +7,7 @@
#### 之前需要用医学相关的词向量,可惜一直找不到,只好自己来做了。
#### 除了这个词向量,还另外整理了一份五千词的生物医学高频词表,通过对医学词汇进行统计,取出现次数在200次以上的医学词汇构建而成,如有需要可直接githu下载med_word.txt。
#### 除了这个词向量,还另外整理了一份五千词的生物医学高频词表,通过对医学词汇进行统计,取出现次数在200次以上的医学词汇构建而成,如有需要可直接github下载med_word.txt。
#### 为了完成这个医学词向量,花了几天时间找了各种医学生物语料库和相关数据集并对其整理。整体语料库包括医学文献,医患对话,维基百科百度知道等医学相关语料,整体语料库共计1.6G,总共7052948句子,仅为生物医学领域相关语料。
#### 使用专业医学类词汇进行分词词汇表详见http://thuocl.thunlp.org/