在政治因素以外,中文訊息的有限本身也是中國開發聊天AI一大瓶頸。現時所有的聊天AI都非常依賴對網絡公開訊息的抓取、自我學習和訓練。而根據Internet World Stats的報告,截至2020年3月,全球互聯網內容中英語內容所占的比例高達59.3%,而漢語內容則只占1.3%,排名第10。盡管就用戶數量而言,漢語使用者占19.4%,僅次於英語。但由於“網絡長城”的存在,他們與世界互聯網的接入度不高,這也限制了有意義的漢語訊息的產生。
與此同時,中共也將這種告密和監視之風延伸到國外。3月,德國媒體CORRECTIV的調查報導指,在德留學的中國公派留學生實際上受到中共嚴密監控,獲中國獎學金的學生需要與中共簽署協議,負責向中國大使館匯報情況,匯報的內容包括課堂上是否存在對中共不利的內容(特別是人文社科),以及刺探其他中國留學生的思想、課堂上的發言、特別是是否有參與政治活動等。這些學生密探有時甚至會出面恐嚇在課堂上發表他們視之為“不當言論”的中國留學生,威脅要向大使館告發他們,或者混入一些政治活動中進行刺探和破壞。這些報導和消息的內容正好與去年12月國際社會主義道路ISA及中國同情者在倫敦大學學院(University College London,UCL)舉行“中國群眾反抗:我們如何才能擊敗獨裁統治”公開會議時,所遭遇到疑似“小粉紅”的破壞行動不謀而合,間接地證明了我們的懷疑。(詳情可參閱我們的文章:《關於中國群眾起義的會議遭遇疑似“小粉紅”的破壞》)