热文NLP练习续集三(纯字典尝试) 整篇分割成段落,段落分割成句子,句子分割成词汇,词汇还能分割成字,既然最小组成单元是字,那么理论上只需要3600左右的常用中文字符就能让程序写出在绝大多数人水准之上的内容?不预训练,不给字设定语义和语境,如何让程序听... Hey2023-05-021093 阅读0 评论
热文NLP练习续集,二(分词还是造词?) 本来尝试直接分字来用key-value键值对循环匹配来模拟RNN(循环神经网络)效果的,但是感觉没什么意义,还不如用词库分词,文章/一句话 可以分割成字词,词语又能分割成字,那我为什么不直接把常用汉字和特定领域的专用... Hey2023-04-301421 阅读0 评论
热文一次小小的NLP领域闭门造车练习 我打算用go语言从零写一个特定领域的中文语言模型,写完这一句我意识到,用英语可能会有更好的效果,然后翻译输出?呃...还是算了吧,本来就因为英语不好看不懂现成的论文才决定自己尝试。现阶段思路:1、用gpt生成或脚本采... Hey2023-04-291092 阅读0 评论