本来尝试直接分字来用key-value键值对循环匹配来模拟RNN(循环神经网络)效果的,但是感觉没什么意义,还不如用词库分词,文章/一句话 可以分割成字词,词语又能分割成字,那我为什么不直接把常用汉字和特定领域的专用名词(待定)搞循环呢?
用数据训练可以快速模仿出效果来,但是遇到没有涉及过的内容依旧效果很差,甚至直接摆烂了。那我直接用全部的字挨个做key 除这个字之外的字全做他的value,自己来造词造句理论上在合适的算法和多维度参数的加持下能实现更强的表达能力?
好吧这个只是存储问题,昨天花了不少时间接触Redis,今天基本上也没有进度,
目前打算先把键值对数据搞好 再去研究怎么让它学习。