영국 레딩대, 챗GPT 대학시험 답지 작성 테스트 진행
▶ 영국 레딩대 연구팀이 대학 시험에서 생성형 인공지능 챗GPT가 작성한 답지 내용을 인간 채점자에게 보여주는 실험 연구를 진행한 결과, 채점자의 94%가 AI가 작성한 답지임을 구별하지 못했다고 플로스원(PLoS ONE) 저널에 발표함
▶ 해당 논문에 따르면 연구진은 심리학 학사 학위 취득 관련 시험 5개 문항(단답형 3개, 에세이 2개)에서 챗GPT-4가 작성한 답지를 가상의 학생 33명의 이름으로 숙련된 인간 채점자에게 제출하면서 AI의 답안지 작성 사실을 숨겼음 (이번 실험에는 인간 학생도 함께 참여했음)
▶ 그 결과, 인간 채점자 94%가 챗GPT-4의 답지를 구별하지 못했음. 답지 평가 점수 결과에서는 챗GPT-4 답지의 평가 점수가 인간 학생 답지의 평가 점수보다 높았음 (연구진은 AI 작성 답안과 인간 학생 답안을 무작위로 선택해 비교하면 AI 작성 답안의 점수가 높을 확률이 83.4%였다고 설명함)
▶ 이에 대해 학계 관계자들은 “인공지능을 악용한 시험 부정행위가 가능함을 보여주는 실험 결과”라고 우려하면서 “인간이 인공지능 콘텐츠를 구별하기가 매우 어려워졌음에도 불구하고 대학은 아직 인공지능 오용에 관한 위협 대처 계획을 마련하지 못하고 있으므로 새로운 정책과 지침 마련 등 문제 해결을 위해 노력해야 한다”고 지적함
<동향리포트>는 글로벌 과학기술문화, 과학·수학·정보 교육 분야의 정책 의사결정자들을 위한
국가별 정책, 연구조사보고서, 유관기관 동향 등 시의성 있는 유용한 정보를 제공합니다.