Обнаружено, что два типа LLM способны сравняться или превзойти человека в тестах на теорию разума
Исследование показало, что большие языковые модели (LLM) GPT-4 и Llama 2 могут выполнять задачи, требующие теории разума, такие как понимание намерений, иронии и ложных убеждений, на уровне, сравнимом с человеческим.