镜像自地址
https://github.com/WENGSYX/Chinese-Word2vec-Medicine.git
已同步 2025-12-06 06:36:47 +00:00
Update readme.md
这个提交包含在:
@@ -11,7 +11,7 @@
|
||||
|
||||
#### 为了完成这个医学词向量,花了几天时间找了各种医学生物语料库和相关数据集并对其整理。整体语料库包括医学文献,医患对话,维基百科百度知道等医学相关语料,整体语料库共计1.6G,总共7052948句子,仅为生物医学领域相关语料。
|
||||
#### 使用专业医学类词汇进行分词(词汇表详见http://thuocl.thunlp.org/)
|
||||
|
||||
#### 注意,因为部分语料来自网络医患对话,导致错别字的出现,比如‘身体’的最近词向量竟是‘生体’,因此请小心使用。
|
||||
### 词向量已上传至百度网盘 欢迎使用
|
||||
|
||||
### https://pan.baidu.com/s/1YqTOlDqZ3bTzGYAGMxW2Cw
|
||||
|
||||
在新工单中引用
屏蔽一个用户