무엇이 일어났는가
미국 워싱턴주립대와 뉴욕주립대 버팔로 캠퍼스의 공동 연구팀이 클로드 ai를 포함한 세 가지 AI 모델을 사용하여 미국 초중등 과학 수업 자료를 평가하는 실험을 진행했다. 이 연구에서는 AI가 교육 자료의 품질을 평가하고, 그 결과를 교육 전문가의 판단과 비교하였다. 연구팀은 648개의 평가 데이터를 생성하였으며, AI의 점수보다 그 이유 설명에 대한 전문가의 동의율이 높았다는 점이 주목받았다.
왜 중요한가
AI의 평가 결과는 교육 분야에서의 활용 가능성을 제시하며, AI가 단순히 점수를 매기는 것 이상의 역할을 할 수 있음을 보여준다. 특히, 클로드 ai는 점수에서 엄격한 평가를 보였지만, 개선 제안에 대한 동의율은 높아 AI의 설명이 교육 전문가들에게 신뢰를 얻었다. 이러한 결과는 AI를 교육 평가에 활용할 때, 점수보다 설명이 더 중요할 수 있음을 시사한다.
다음 단계는 무엇인가
한편, 앤트로픽은 중국의 AI 기업들이 클로드 ai를 악용하고 있다고 주장하며, 이들 기업이 수천 개의 가짜 계정을 만들어 클로드와의 대화를 생성하고 그 데이터를 자사 AI 모델 훈련에 활용했다고 밝혔다. 이러한 행위는 미국의 기술과 지식재산권을 침해하는 것으로, 앤트로픽은 이 문제에 대한 업계와 정책 당국의 공조를 촉구하고 있다.