unify tiktoken model

这个提交包含在:
Your Name
2023-04-17 19:41:50 +08:00
父节点 40bc865d33
当前提交 2472185de9
共有 8 个文件被更改,包括 9 次插入9 次删除

查看文件

@@ -13,7 +13,7 @@ class PaperFileGroup():
# count_token
import tiktoken
from toolbox import get_conf
enc = tiktoken.encoding_for_model(*get_conf('LLM_MODEL'))
enc = tiktoken.encoding_for_model("gpt-3.5-turbo")
def get_token_num(txt): return len(enc.encode(txt, disallowed_special=()))
self.get_token_num = get_token_num