وتضيف إيبوليتو، التي أجرت دراسة في 2019 عن النصوص المكتوبة بالذكاء الاصطناعي، أن النماذج اللغوية الكبيرة مثل برنامج "شات جي بي تي" تعمل من خلال التنبؤ بالكلمة التالية في الجملة.

لذا من المرجح أن تستخدم كلمات شائعة مثل "the" أو "it" أو "is" بدلاً من الكلمات الأخرى التي لن يكررها البشر في كتابتهم.

وجدت "إيبوليتو" وفريقها البحثي أن هذا هو بالضبط نوع النص الذي تجيد أنظمة الكشف الآلية التقاطه.

لكن في المقابل، أظهرت دراسة "إيبوليتو" أيضًا شيئًا مثيرًا للاهتمام، يتمثل في خطأ الاعتقاد السائد بأن النص الذي كتبه بشر يبدو أفضل ويحتوي على أخطاء أقل.

وفي الواقع، كان النص المكتوب من قبل الإنسان مليئا بالأخطاء المطبعية بشكل متغير من شخص لآخر، حيث يشتمل على خصائص مختلفة ولغات عامية، بينما "نماذج اللغة الآلية نادرًا جدًا ما تصنع أخطاء مطبعية.

وعقبت "إيبوليتو" أن نماذج اللغة الآلية أفضل بكثير عندما يتعلق الأمر بإنشاء نصوص مثالية، مضيفة أن "الخطأ المطبعي في النص هو في الواقع مؤشر جيد على أنه كتب بواسطة الإنسان".