한국어판 간호대학생의 인공지능에 대한 태도 측정도구 신뢰도 및 타당도 검증

The validity and reliability of the Korean version of the General Attitudes towards Artificial Intelligence Scale for nursing students

Article information

J Korean Acad Soc Nurs Educ. 2022;28(4):357-367
Publication date (electronic) : 2022 November 30
doi : https://doi.org/10.5977/jkasne.2022.28.4.357
서연희1)orcid_icon, 안정원2),orcid_icon
1) 여주대학교 간호학과, 조교수
1) Assistant Professor, Department of Nursing, Yeoju Institute of Technology
2) 강릉원주대학교 간호학과, 조교수
2) Assistant Professor, Department of Nursing, Gangneung-Wonju National University
Address reprint requests to: Ahn, Jung-Won Department of Nursing, Gangneung-Wonju National University, 150, Namwon-ro, Heungeop-myeon, Wonju-si, Gangwon-do, 26403, Republic of Korea Tel: +82-33-760-8678, Fax: +82-33-760-8641, E-mail: jwahn@gwnu.ac.kr
Received 2022 May 1; Revised 2022 July 23; Accepted 2022 August 15.

Abstract

Purpose:

The aim of the study was to verify the validity and reliability of the Korean version of the General Attitudes towards Artificial Intelligence Scale (GAAIS-K) for nursing students.

Methods:

Data from 235 participants were collected from April 12 to April 26, 2022. A total of 230 participants’ data were analyzed. The data were analyzed for content, discriminant, known-groups, and construct validity using content validity index, correlation coefficient, and confirmatory factor analyses. The reliability of the GAAIS-K was examined using internal consistency and test-retest analyses.

Results:

The expert-rated content validity index was ≥.80. The sub-scales of the GAAIS-K were moderately correlated with attitude toward accepting technology, indicative of its discriminant validity. The male students’ positive attitude score was significantly higher than that of the female students, satisfying the known-groups validity. Cronbach’s α for the scale was .86 (positive) and .74 (negative), and the intra-class correlation coefficient for the two-week test-retest reliability was .86 (positive) and .60 (negative). The scores for positive and negative attitudes were 3.68±0.46 and 3.05±0.55.

Conclusion:

This study shows that the GAAIS-K is a valid and reliable instrument for assessing nursing students. Additional research is recommended to continue the evaluation of the GAAIS-K with a focus on healthcare settings.

서 론

연구의 필요성

인공지능(Artificial Intelligence)은 인간의 지능으로 할 수 있는 사고와 학습 등을 컴퓨터가 할 수 있도록 모방한 컴퓨터 프로그램으로[1], 인간의 인지능력, 학습능력, 이해능력, 추론능력 등을 실현하는 기술을 의미한다[2]. 최근 인공지능 기술의 도입은 모든 산업 분야에 걸쳐 광범위하게 일어나고 있다. 인공지능 기술을 적용한 웨어러블 디바이스는 신체 일부에 착용함으로써 개인의 생체신호를 모니터링하고 분석한다[3,4]. 또한 병동에서 인간 간호사를 대체할 수 있는 인공지능 간호사 로봇[5,6], 노인과 같은 특별한 관심이 필요한 대상자들에게 유용한 동반자 로봇[7], 약물 관리에서 간호사의 업무 부담을 감소해줄 수 있는 자동 분배 로봇[8] 등과 같은 다양한 인공지능 기술의 활용은 임상현장에서 간호사를 포함한 의료인의 역할을 변화시키고 보건의료 패러다임의 변화를 가져올 것으로 예상된다.

간호사는 인공지능 기술의 잠재적인 사용자로서 그리고 간호 전문가로서 간호 분야에서 인공지능의 활용을 구체화하고 이끌 수 있는 핵심적인 위치에 있다[9]. 즉 간호사들은 임상현장에서 인공지능 기반 헬스케어기술을 활용하는 것에 익숙해져야 할 뿐만 아니라 인공지능을 활용하기 위해 요구되는 지식, 기술 및 태도를 갖추는 것이 필요하다[10]. 그러나 현재까지 머신 러닝, 딥 러닝, 자연어(natural language) 처리를 포함한 인공지능 응용 프로그램과 간호 현장에서 활용되는 인공지능의 잠재적인 역할을 이해하는 간호사는 여전히 부족한 실정이다[11]. 간호대학생을 포함한 간호사들을 대상으로 한 연구에서는 70.0% 이상이 의료현장에서 사용되는 인공지능 기술을 이해하지 못할 뿐 아니라[10], 임상현장에서 인공지능과 같은 새로운 기술을 활용하는데 있어 어려움을 겪고 있는 것으로 나타났다[4]. 따라서 인공지능 기술이 보건의료분야에 도입되고 있는 과도기적인 시점에서 예비 의료인인 간호대학생이 일상생활에서 직‧간접적으로 경험하는 인공지능에 대한 잠재적 위험과 혜택을 어떻게 인식하고 있으며, 인공지능에 대해 어떤 정서적 태도를 가지고 있는지를 파악하는 것이 앞으로 간호사들이 인공지능 기술을 임상현장에서 성공적으로 도입하는 데 있어 중요하다.

기술수용모델(technology acceptance model, TAM)은 혁신적인 과학기술에 대한 이용자들의 수용 행동을 측정하는 도구이자 설명하는 이론으로 사용되었다[12]. 이 이론은 지금까지 다양한 종류의 정보기술에 대한 사용자의 수용행동을 설명하는 데 적용되어 왔으나, TAM에서는 지각된 유용성 및 사용 용이성, 태도, 사용 의도 및 행위만을 모형에 반영하고, 기술수용 과정에 영향을 미칠 수 있는 외부변수들(주관적 규범 등)을 구체적으로 설명하고 있지 않다[13]. 또한, TAM은 인공지능이 아닌 전반적 기술에 초점을 두고, 기술의 사용자가 아닌 기술 채택자(정부 및 기관)의 의지를 반영하고 있어, 신기술 이용자의 태도 측정도구로 적절하지 않은 제한점이 있다[14]. TAM의 검증 연구에서 기술수용에 대한 태도 측정 도구를 개발하였지만[15], 문항수가 적고 측정 문항의 내용이 구체적이지 않은 제한점이 있다. 유사한 개념으로 TAM을 기반으로 개발된 기술준비도(Technology Readiness Index)는 가정과 직장에서 목표 달성을 위해 새로운 기술을 채택하고 사용하려는 태도를 측정하기 위해 개발된 도구이다[16]. 기술수용 활성요인(낙관성, 혁신성)과 기술수용 저해요인(불편함, 불안감)의 총 4개 영역으로 구성되어 기술수용에 대한 태도 도구[17]보다 구체적인 평가가 가능하지만, 도구의 타당성 및 일반화 가능성이 제한적이라는 평가를 받았다[15]. 이에 Lin과 Hsieh [15]는 Parasuraman [16]이 개발한 36개 문항의 기술준비도 측정도구를 연구자와 실무자가 모두 사용할 수 있고 일반화 가능성을 높일 수 있도록 수정‧보완한 총 16개 문항의 단축형 형태로 검증하여 제시하였지만[15], 단순히 도구의 문항 수를 줄이는 것에 그쳤고, 새로운 기술을 컴퓨터와 인터넷 사용으로 국한하는 문항으로 구성하여[14] 인공지능에 대한 태도 측정도구로 사용하기에 제한적이다.

태도는 선척적인 요소가 아니며, 개인의 특성, 교육이나 일상에서 직 ‧ 간접적 경험 및 감정에 의해 변화할 수 있다[18]. 특히, 학생들의 인공지능에 대한 태도는 나이와 학년에 따라 달라질 수 있기 때문에[19] 초등학생이나 중‧고등학생을 대상으로 개발된 도구를 사용할 경우, 간호대학생들의 인공지능에 대한 태도를 정확하게 반영하기에는 한계가 있다. 이에 Schepman과 Rodway [14]는 성인을 대상으로 인공지능 기술이 활용되는 개인의 일상생활과 간호를 포함한 다양한 업무환경에서 경험한 인공지능 기술에 대한 긍정적 태도와 부정적 태도를 동시에 측정할 수 있는 도구로 General Attitudes towards Artificial Intelligence Scale (GAAIS)를 개발하여 신뢰도와 타당도 검증하였다. 이에 본 연구에서는 Schepman과 Rodway [14]의 GAAIS를 한국어로 번역(Korean version of the General Attitudes towards Artificial Intelligence Scale, GAAIS-K)하고 국내 간호대학생을 대상으로 한국어판 인공지능에 대한 태도 측정도구의 신뢰도와 타당도를 확인하여 예비 간호사들의 인공지능에 대한 태도를 확인할 수 있는 기초자료로 마련하고자 한다.

연구 목적

본 연구의 목적은 Schepman과 Rodway [14]가 개발한 GAAIS를 한국어로 번역하고 간호대학생을 대상으로 GAAIS-K의 타당도와 신뢰도를 검증하는 것이다.

연구 방법

연구 설계

본 연구는 Schepman과 Rodway [14]가 다양한 직종에 근무하는 성인을 대상으로 개발한 인공지능에 대한 태도 측정도구를 한국어로 번역하여 국내 간호대학생을 대상으로 GAAIS-K의 타당도와 신뢰도를 검증하기 위한 방법론적 연구이다.

연구 도구

● 인공지능에 대한 태도

인공지능에 대한 태도 측정도구는 Schepman과 Rodway [14]가 18세 이상 성인을 대상으로 개인 영역과 직업적 환경 모두에서 인공지능의 영향을 받을 가능성이 있는 광범위한 사회경제적 범위의 직업(영업사원, 정보보안전문가, 교수, 변호사, 의사 또는 수의사 등)의 종사자를 대상으로 인공지능에 대한 태도를 측정하기 위해 개발된 도구이다. 예비 간호사들의 인공지능에 관한 태도를 확인하기 위해 설문 지시문에 ‘인공지능이 간호와 보건영역 및 우리의 일상생활에서 사용되는 것에 관한 생각을 묻는 것입니다’라는 문구를 삽입하였다. 원 도구는 긍정적 태도 12개 문항과 부정적 태도 8개 문항의 총 20개 문항으로 구성되었다. 긍정적인 태도는 인공지능의 사회적 또는 개인적 유용성, 단순 업무처리에서의 사람보다 인공지능의 선호도 및 인공지능에 대한 흥미 등과 같은 긍정적인 감정 요소로 구성되었고, 부정적인 태도는 주로 인공지능 사용에 대한 디스토피아적 관점(비윤리적, 오류 발생 가능성, 인공지능이 사람을 통제하거나 감시하는 등)의 부정적 감정과 인공지능기술 사용에 대한 불편감에 대한 정서적 태도로 구성되었다[14]. 각 문항은 ‘전혀 그렇지 않다’ 1점, ‘그렇지 않다’ 2점, ‘보통이다’ 3점, ‘그렇다’ 4점, ‘매우 그렇다’ 5점으로 구성된 5점 Likert 척도로, 점수가 높을수록 부정적 태도 혹은 긍정적 태도가 높음을 의미한다. 도구개발 당시 Cronbach’s α값은 긍정적 태도 .88과 부정적 태도 .83이었고[14], 본 연구에서는 .86와 .74였다.

● 기술수용에 대한 태도

수렴타당도 검증을 위한 도구로 기술수용모델 검증 연구에서 기술에 대한 수용 태도를 측정한 4개 문항[15]을 사용하여 인공지능에 대한 태도 점수와 상관관계 분석을 시행하였다. 원문에서 시스템과 테크놀로지를 보건의료분야에 대한 인공지능 기술수용에 대한 태도를 측정하는 것으로 수정하였다. 응답 방법은 5점 Likert 척도를 사용하여, ‘전혀 그렇지 않다(1점)’에서 ‘매우 그렇다(5점)’로 평가하였고, 점수가 높을수록 기술적용에 대해 수용적임을 의미한다. GAAIS-K의 전문가 내용타당도(content validity index, CVI) 검증 결과는 .9 이상이었다. 선행연구[15]에서 보고된 Cronbach’s α는 .77∼.84, 본 연구에서는 .82였다.

도구 번역 과정

● 도구 번역

본 연구는 Sousa와 Rojjanasrirat [20]의 도구 번역 절차에 따라 진행하였다. GAAIS를 개발한 원저자에게 이메일을 통해 도구의 사용 및 번안에 대한 승인과 도구 원본을 제공받았다. 번역과정에서 ‘routine transactions’의 해석을 명확하게 하려고 저자에게 한 차례 메일로 문의를 하여 번역의 정확성을 재확인하였다. 영문으로 작성된 원도구의 1차 국문 번역은 영어권에서 학위취득을 하고 거주 기간이 5년 이상인 간호학 전공 교수 2인이 독립적으로 시행한 후, 다른 표현에 관한 논의를 거쳐 번역본을 수정하였다. 한국어판 도구를 한국어와 영어의 이중 언어 사용이 가능한 전문가에게 번역 과정의 정확성과 표현의 적합성에 대하여 검토를 받았다. 역 번역은 한국어로 번역된 도구를 영문학을 전공하고, 전문 번역가로 활동 중인 1인에게 역번역을 의뢰하였고, 역번역된 문항을 연구자 2인이 원도구와 비교하면서 수정하였고 영문학 전공자에게 재검토를 의뢰하는 과정을 거쳐 1차 번역본을 최종화하였다.

● 내용타당도 검증

번역한 도구에 대한 전문가 검증을 위해 인공지능 관련 수업을 운영하는 공학박사 1인, 임상경력 3년 이상이며 도구개발 경험이 있는 간호학 교수 8인, 심리학 박사 1인에게 내용타당도에 대한 평가를 의뢰하였다. 전문가 내용타당도인 CVI 평가는 Lynn [21]의 도구평가방법에 따라 4점 Likert 척도로 안면타당도를 평가하여 도구의 구성요소와 구성요소에 대한 문항의 적합성을 평가하는 것이다. 이 과정에서 문장이 매끄럽지 않거나 용어의 의미가 애매한 문항에 관한 의견을 수집하였고, 연구자 논의를 통해 수정하였다. 수정의 예로 1번 문항에서 ‘일상적인 거래’가 의미하는 바를 명확하게 기술하라는 의견을 반영하여 괄호를 사용하여 ‘금융, 예약 등’의 일상적인 거래의 예시를 추가하였다. 이와 함께 문항별 신뢰도인 item-level CVI (I-CVI)와 scale level CVI (S-CVI)의 평균값인 S-CVI/Ave를 산출하였다. 문항별 응답 방법은 ‘적절하면서 명료하다(4점)’, ‘적절하나 약간의 수정이 필요하다(3점)’, ‘문항의 수정 없이 적절성을 평가할 수 없거나 관련이 없다(2점)’, ‘적절하지 않다(1점)’로 하였다.

● 예비조사

번역한 GAAIS-K를 이용하여 20∼30세 간호학과 학생 5명과 인공지능에 대한 이해도가 높은 컴퓨터계열 전공 대학생 5명을 대상으로 예비조사를 시행하였다. 예비조사 대상자에게 문장이나 표현이 모호하거나 이해가 어려운 문항에 대해 파악하고 수정과정을 거쳐 최종도구를 확정하였다.

도구 평가 과정: 타당도와 신뢰도 검증

● 연구 대상자

연구자가 소속되지 않은 간호학과 재학생 중 최소 1개 이상의 임상실습 교과목을 수강한 경험이 있는 자를 연구 대상으로 선정하였고, 본 연구의 목적을 이해하고 참여를 서면 동의한 자에게 자료수집을 하였다. 도구 검증을 위한 연구 대상자 수는 AMOS 프로그램을 이용한 확인적 요인분석 시 권고한 표본 크기 200∼400명[22]을 근거로 탈락률을 고려하여 총 235부를 수집하였으며, 분석 결과, Z-score가 절대값 3 이상인 표본 5개를 삭제한 후 230부를 최종 분석하였다.

● 자료수집방법

수도권에 있는 1개 대학 학과장의 동의와 협조를 얻어 연구대상자를 모집하였다. 해당 대학의 3, 4학년 학생 수는 약 350명으로 해당 학년의 학과 게시판에 모집공고문을 게시하였다. 타기관에 재직 중인 연구보조원이 수업시간 전 혹은 쉬는 시간에 교실에 방문하여 연구 및 참여방법에 관해 설명하였고, 참여를 원하는 대상자에게 서면 동의서와 설문지를 제공하였다. 게시판 옆에 설문지 수거함을 설치하여 작성된 동의서와 설문지를 수거하였다. 자료수집 기간은 2022년 4월 12일에서 26일까지였다.

● 최종 도구의 타당도와 신뢰도 검증

타당도는 전문가 내용타당도와 확인적 요인분석을 이용한 구성타당도, 문항의 수렴타당도 및 집합타당도 검정을 시행하였다. 하위요인간의 상관관계는 각 문항과 수정된 문항-총점 상관계수를 평가하였고, 이후 구성요인별로 분류하여 문항-총점 상관계수를 계산하여 구성요인 내 문항의 기여 정도를 측정하였다. 신뢰도로 내적 일관성과 2주 후 검사-재검사를 평가하였다. 인구사회학적 특성 중에 성별과 관련하여 선행연구에서 남학생의 인공지능에 대한 태도가 긍정적이었다는 연구결과[23,24]를 기반으로 하여, 본 연구에서는 ‘남학생의 인공지능에 대한 긍정적 태도 점수가 높을 것이다’라는 가설을 세워 집합타당도 검정을 수행하였다.

자료 분석 방법

수집된 자료는 IBM SPSS statistics version 26.0과 SPSS AMOS version 26.0 (IBM Corp., Armnok, NY, USA) 통계 프로그램을 이용하여 분석하였다.

∙ 대상자의 일반적 특성 및 측정변수는 평균과 표준편차, 실수와 백분율을 이용하여 분석하였다.

∙ 문항분석은 문항별 평균과 표준편차, 첨도와 왜도를 산출하여 검증하였다. 또한, 전체문항과 개별문항의 상관계수를 확인하여 .4 이상을 기준으로 문항을 채택하였다.

∙ 타당도는 내용타당도, 구성타당도 및 문항의 수렴타당도를 검증하였다. 내용타당도 평가는 CVI를 산출하였다. 구성타당도로 상관분석과 문항분석을 시행한 후, 확인적 요인분석과 모형적합성 평가를 진행하였다. 모델 적합도는 카이제곱/자유도(χ2 /df), goodness of fit index (GFI), adjusted goodness of fit index (AGFI), normed fit index (NFI), root mean square residual (RMR), root mean square error of approximation (RMSEA), standardized root mean square residual (SRMR), comparative fit index (CFI), Tucker–Lewis index (TLI)를 평가하였다[25]. 문항들의 수렴타당도는 개념신뢰도(composite construct reliability, CCR)와 평균분산 추출값(average variation extracted, AVE)으로 분석하였다. 측정 개념에 대한 문항의 수렴타당도 평가를 위해 기술수용에 대한 태도 점수와 상관분석을 시행하였다. 집합타당도 효과 크기 검정은 Cohen’s d로 분석하였다.

∙ 신뢰도는 문항 내 내적일관성을 확인할 수 있는 Cronbach’s α값을 산출하였고, 도구의 안정성검증을 위해 2주 간격의 검사-재검사 신뢰도를 평가하여 측정 점수 간 급내 상관계수(intraclass correlation coefficient, ICC)를 산출하였다.

윤리적 고려

본 연구는 중앙대학교 윤리심의위원회의 승인(IRB No. 10410 78-202201-HR-030)을 받은 후 시행하였다. 연구대상자에게 연구의 목적과 참여방법에 관한 내용을 설명한 후, 자발적으로 참여를 원하는 대상자에게 참여에 대한 동의와 설문자료 수집에 대한 서명을 받았다. 연구에 참여하지 않아도 어떤 불이익이 없다는 점과 연구 진행 중 본인이 원하지 않으면 언제라도 연구 참여를 중단할 수 있음을 공지하였다. 설문지는 익명으로 작성하였고 설문지에는 설문지 번호를 부여하였다. 검사-재검사를 위해 2주 후 재설문 참여에 동의한 대상자의 설문지 번호와 연락처를 별지에 작성하였고, 설문이 종료된 즉시 폐기하였다. 설문조사 참여자에게 소정의 기프티콘을 발송하였다.

연구 결과

대상자의 일반적 특성

참여자의 성별은 여성이 203명(88.3%)이었고, 평균연령은 24.62±6.56세, 학년은 3학년 140명(60.9%), 4학년 90명(39.1%)이었다. 학습 이외의 목적으로 인터넷을 사용하는 시간은 하루 평균 4.35±2.42시간이었고, 인터넷 사용 목적은 메신저 혹은 소셜 네트워킹 서비스 사용, 영상시청, 정보검색, 게임 순으로 많았다. 인공지능과 관련된 교육을 받은 경험이 있는 대상자는 46명(20.0%)이었고, 복수응답자를 포함하여 총 51개의 교육 주제가 제시되었다. 교육 주제는 인공지능과 직업변화에 관한 교육경험자가 18명(7.8%)으로 가장 많았고, 인공지능 기초, 인공지능 기술의 응용, 인공지능 관련 데이터 과학과 정보학, 윤리적 고려 및 인공지능의 강점과 한계 순으로 많았다(Table 1).

Characteristics of Participants (N=230)

인공지능에 대한 태도

인공지능에 대한 긍정적 태도의 평균 점수는 3.69±0.45점, 부정적 태도의 평균 점수는 3.07±0.55점이었다. 긍정적 태도에서 가장 점수가 높은 두 문항은 ‘단순 업무에서 인공지능 시스템이 사람보다 나을 수 있다’ (4.10±0.68점), ‘인공지능의 유익한 활용법이 많다’ (4.00±0.59점)였다. 긍정적 태도 점수가 낮은 두 문항은 ‘나는 인공지능이 할 수 있는 기능에 깊은 인상을 받았다’ (3.31± 0.82점)와 ‘인공지능 시스템은 사람이 더 행복해지도록 도울 수 있다’ (3.36±0.80점)였다. 부정적 태도에서 가장 점수가 높은 두 개 문항은 ‘나는 인공지능이 해롭다고 생각한다’ (3.62±0.75점), ‘나와 같은 사람들은 인공지능이 더 많이 사용될수록 괴로울 것이다’ (3.50±0.88점)였다. 부정적 태도 점수가 가장 낮은 문항은 ‘나는 인공지능이 사람을 제어할 수도 있을 것이라고 생각한다’ (2.59±1.04점), ‘나는 인공지능 시스템이 오류를 많이 범한다고 생각한다’ (2.68±0.75점)였다(Table 2).

Item Analysis of the General Attitudes towards Artificial Intelligence Scale (N=230)

도구의 타당도

내용타당도 검증을 위한 CVI 산출결과 I-CVI는 .80~1.00이었고, S-CVI/Ave는 .98로 권장수준을 충족하였다. 문항분석 결과 문항평균의 분포는 2.59점에서 4.10점이었고, 왜도는 -0.71에서 0.67, 첨도는 -0.78에서 0.34로 정규분포를 보였다. 문항-총점 간 상관계수는 .48에서 .74로 모두 .40 이상이었고, 확인적 요인분석에서 1번과 20번 삭제 후, 문항-총점 간 상관계수는 .48에서 .77이었다(Table 2).

확인적 요인분석 결과 긍정적 태도 영역 내 문항 1번인 ‘일상적인 거래에서 인간보다 인공지능 시스템 활용을 선호한다’의 적재값이 .34로 낮아 삭제하였고, 재분석 결과 부정적 태도 영역 내 20번 문항인 ‘인공지능은 사람들을 감시하는데 사용된다’의 요인 적재값이 .37로 낮아 삭제하였다. 18개 문항의 분석 결과 문항별 요인 적재값은 긍정적 태도가 .41∼.77, 부정적 태도가 .41∼.72로 .40 이상의 기준[26]에 부합하였다. 두 문항 삭제 후 확인적 요인분석을 시행하였고, 모형의 수정지수가 10 이상인 내생잠재변수의 측정오차 간에 경로를 추가하여 공분산을 허용하는 수정을 거쳤다. 수정 전 모형적합도는 χ2 (p)=297.64 (<.001), df=134, χ2 /df=2.22, GFI=.87, AGFI=.84, NFI=.78, RMR=.05, RMSEA=.07, SRMR=.08, CFI=.86, TLI=.85였다. 수정 후, 모형적합도는 χ2 (p)=221.34 (<.001), df=128, χ2/df=1.73, GFI=.91, AGFI=.88, NFI=.84, RMR=.05, RMSEA=.06, SRMR=.07, CFI=.92, TLI=.90이었고, 요인 적재값은 .41∼.77로 기준에 충족하였다(Figure 1). 문항의 수렴타당도를 확인하기 위해 AVE를 산출한 결과 .91과 .84로 기준치인 .50보다 크기 때문에 문항들의 수렴타당성이 충족되었다. 긍정적 태도와 부정적 태도 점수의 상관계수 값(r=.25)이 AVE값의 제곱근 값보다 작아 문항의 판별타당도가 충족되었다(Table 3). 측정 개념에 대한 수렴타당도의 평가를 위해 기술수용에 대한 태도 점수와 GAAIS-K 점수 간 상관분석을 시행한 결과 긍정적 태도와의 상관계수는 r=.58 (p<.001), 부정적 태도와의 상관계수는 r=.27 (p<.001)이었다. 일반적 특성에 따른 인공지능에 대한 태도 점수 분석 결과, 남학생의 인공지능에 대한 긍정적 태도 점수가 유의하게 높아 집합타당도가 검증되었다(t=1.98, p<.049, Cohen’s d=.39).

Figure 1

Modified confirmatory factor analysis of the general attitudes towards artificial intelligence scale

Confirmatory Factor Analysis of the General Attitudes towards Artificial Intelligence Scale (N=230)

도구의 신뢰도

내적 일관성 검증을 위한 Cronbach’s α를 산출한 결과 긍정적 태도는 .86, 부정적 태도는 .74였다. 도구의 안정성 검증을 위한 검사-재검사 신뢰도 평가를 위한 설문 참여에 동의한 대상자 20명에게 첫 설문 2주 후 GAAIS-K를 이용한 재조사를 시행하였다. 검사-재검사 간 ICC는 r=.86 (95% confidence interval, CI: .67∼.95, p<.001), 부정태도 r=.60 (95% CI: .20∼.83, p=.025)이었다(Table 3).

논 의

본 연구에서는 인공지능에 대한 태도를 측정하기 위해 개발된 GAAIS [14] 한국어판의 타당도와 신뢰도를 국내 간호대학생을 대상으로 검증하였다. 연구 절차는 Sousa와 Rojjanasrirat [20]의 도구 번역 및 타당도 검증 가이드라인에 따라 체계적으로 수행되었다. 간호대학생 230명을 대상으로 GAAIS-K에 대한 구성타당도, 수렴타당도, 집합타당도, 문항의 판별타당도 및 신뢰도를 검증한 결과로 ‘인공지능에 대한 긍정적 태도’와 ‘인공지능에 대한 부정적 태도’ 2개 하위요인의 총 18문항 도구를 최종적으로 확정하였다.

구성타당도 검증과정에서 삭제된 2개 문항 중 긍정적 영역의 1번 문항은 ‘일상적인 거래에서 인간보다 인공지능 시스템 활용을 선호한다’이다. 해당 문항은 원도구 저자에게 명확한 의미를 확인하는 과정을 거쳤고, 내용타당도 검증 시 ‘일상적인 거래’가 의미하는 바를 구체적으로 기술하라는 전문가의 의견을 반영하여 ‘금융, 예약 등’의 예시를 추가했음에도 불구하고, 요인부하량이 낮게 나타났다. 연구자 논의결과, 7번 문항 ‘나는 일상생활에서 인공지능 시스템을 사용하는데 관심이 있다’, 14번 문항 ‘인공지능의 유익한 활용법이 많다’ 등과 의미가 중첩되는 부분이 있어 최종 도구에서 삭제하였다. 부정적 영역의 20번 문항인 ‘인공지능은 사람들을 감시하는데 사용된다’는 문항도 분석 결과, 요인부하량이 낮아 연구자 간 논의 후 최종 도구에서 삭제하기로 하였다.

수렴타당도와 집합타당도 검증을 시행하기 위해 먼저, 기술수용에 대한 태도[17] 점수와 인공지능에 대한 태도 점수의 상관관계 분석을 시행하였다. 선행연구[14]에서 기술준비도[16,27]와 GAAIS 점수의 상관관계를 분석한 결과 긍정적 태도와 혁신성과 낙관성 간의 상관지수는 .42∼.58이었고, 부정적 태도와는 .20∼.22로 나타났다. 본 연구에서 기술수용에 대한 태도와 인공지능에 대한 긍정적 태도와의 상관지수는 .58, 부정적 태도와 상관지수는 .27로 선행연구와 유사하여 수렴타당도가 충족되었다. 집합타당도 검증을 위해 선행연구에서 의대생을 대상으로 인공지능과 로봇공학에 대한 익숙함[23]과 태도[24]에 대해 조사한 결과, 남학생이 여학생보다 인공지능에 익숙하다고 응답한 것과[23], 긍정적인 태도[24]를 갖고 있다고 보고한 것을 바탕으로 ‘남학생의 인공지능에 대한 긍정적 점수가 높을 것이다’라는 가설을 검증한 결과, 본 연구에서도 남학생의 긍정적 점수가 여학생의 점수보다 유의하게 높았고, 효과크기가 중간 수준으로 가설이 지지되어 집합타당도가 충족되었다.

신뢰도 검증을 위한 내적 신뢰도 분석 결과, 도구의 Cronbach’s α는 .86과 .74로 일반적인 신뢰도 판단 기준인 .70 이상[28]을 충족하였다. 이 밖에도 안정성 검사를 위해 2주 간격을 두고 시행된 검사-재검사에서 결과 간 ICC의 신뢰도는 .86과 .60으로 ‘좋음’ 이상 수준의 일치도를 보여[29], GAAIS-K의 신뢰도가 타당한 수준임을 확인하였다.

본 연구에서 인공지능에 관한 긍정적 태도 점수는 3.68±0.46점, 부정적 태도 점수는 3.05±0.55점이었다. 원도구 개발 연구에서 영국인 남성 50명, 여성 50명의 총 100명에게 조사를 시행한 결과는 긍정적 태도 점수 3.60±0.67점, 부정적 태도 2.93±0.75점으로[14] 본 연구 참여자의 인공지능에 대한 태도가 좀 더 긍정적 혹은 유사한 수준임을 확인하였다. 세부 문항별 점수를 원도구 개발 연구와 비교해보면 대부분 큰 차이는 없었으나, 본 연구에서 긍정적 태도 문항 중 ‘단순 업무에서 인공지능 시스템은 사람보다 나을 수 있다’의 점수 결과가 두 연구 간 상이하였다. 본 연구에서 해당 문항의 점수는 4.10점로 긍정적 태도 문항 점수 중 가장 높았는데, 원도구 개발 연구에서는 3.08점으로 점수가 가장 낮은 문항으로 보고되었다[14]. 이는 본 연구에서 대상자들에게 간호 및 보건 분야에서의 인공지능 이용에 관해 질문하였고, 선행연구[14]에서는 포괄적 영역에서의 인공지능 이용을 물었기 때문에 연구 결과가 상이하였을 것으로 유추해 볼 수 있다. 다른 이유로 원도구 개발 연구[14] 대상자는 다양한 직업의 종사자로 평균연령이 36.15세였고, 대상자의 성비는 1:1로 동일한 반면, 본 연구대상자는 간호대학생이고 참여자의 연령이 24.62세이고 여성의 비중이 높았다는 점에서 선행연구[14]와의 차이가 있었다. 하지만, 이와 관련하여 비교할 수 있는 선행연구가 제한적이기 때문에 추후 연구에서 대상자 특성별로 연구 대상을 구분하여 일반적 특성에 따른 인공지능에 대한 태도의 차이가 있는지 재확인해볼 필요가 있다.

인공지능을 기반으로 급속도로 발전하는 보건의료분야의 변화에 따라 최근 간호학과의 교육커리큘럼에 인공지능과 딥러닝, 간호정보, 컴퓨팅적 사고 및 프로그래밍 등에 관한 수업 도입의 필요성이 지속적으로 제기되고 있는 과도기적인 시점이다[1,3-8,10]. 본 연구는 인공지능에 대한 태도 측정도구가 부족한 현 상황에 이를 측정할 수 있는 GAAIS를 번역하고 타당도와 신뢰도를 검증하여 국내에서의 활용을 가능하게 한 점, 간호사 및 간호대학생의 인공지능에 대한 태도를 보고한 연구 결과가 거의 없는 시점에 예비 의료인인 간호대학생을 대상으로 이를 측정하고 기초자료로 제공하였다는 데 연구의 의의가 있다. GAAIS-K는 일상생활의 인공지능에 대한 흥미 등을 포함한 개인의 감정적 영역에서 인공지능을 활용함으로써 업무의 효율성까지 다양한 영역에서의 인공지능에 대한 전반적인 태도를 측정할 수 있는 도구[14]로도 의의가 있다. 본 연구에서는 간호대학생을 대상으로 GAAIS-K의 타당도와 신뢰도를 검증하였으나, 연구를 통해 건강관련 타전공학생 및 간호사를 대상으로도 타당도와 신뢰도 검증을 시행하여 도구의 활용 대상을 확장할 수 있을 것이다. 본 연구의 제한점으로는 연구 대상이 일개 대학의 간호대학생으로만 구성되었고, 일부 학생의 경우 임상 실습 경험이 길지 않아 연구 결과의 해석과 일반화에 주의를 기울여야 할 것이다. 또한, 확인적 요인분석 결과에서 일부 문항의 요인 적재값이 .40∼.50 범위에 있었던 점에 관한 추가 검증이 필요할 것이다. 추후 연구에서 대상자의 학교와 전공 등 표본 집단을 확대하여 간호학과 학생뿐만 아니라 보건계열 학생, 간호사를 포함한 보건계열 종사자 대상으로 반복 연구 수행할 것을 제언한다.

결론 및 제언

본 연구는 국내 간호대학생을 대상으로 인공지능에 대한 태도를 측정하기 위해 개발된 GAAIS-K의 타당도 검증을 시행하였다. 연구결과 GAAIS-K는 긍정적 태도 11개 부정적 태도 7개의 총 18개 문항의 형태로, 간호대학생의 인공지능에 대한 태도를 측정하는데 타당도와 신뢰도를 확보한 도구로 확인되었다. 간호 분야의 인공지능에 대한 태도 관련 연구가 다소 제한적인 만큼 간호실무, 연구 및 교육 영역을 확대하기 위한 기초자료로 활용할 수 있을 것이다. 앞으로 다양한 보건의료 서비스 영역 내에 인공지능기술 및 정보화 도입에 있어서 보건의료 인력의 관련 장벽을 식별할 수 있고, 교육 내용 개발 시 대상자 특성에 맞는 요구를 수렴할 수 있을 것으로 기대한다.

Notes

No potential conflict of interest relevant to this article was reported.

Funding

None

Acknowledgements

None

Supplementary materials

None

References

1. Jiang F, Jiang Y, Zhi H, Dong Y, Li H, Ma S, et al. Artificial intelligence in healthcare:Past, present and future. Stroke and Vascular Neurology 2017;2(4):230–243. https://doi.org/10.1136/svn-2017-000101.
2. Hong JP, Kim EJ, Park HY. An analysis of determinants for artificial intelligence industry competitiveness. Journal of the Korea Institute of Information and Communication Engineering 2017;21(4):663–671. https://doi.org/10.6109/jkiice.2017.21.4.663.
3. Song DU, Jeong DG. Trend on intelligent medical devices and service. Journal of Korean Institute of Information Technology 2017;15(2):41–48.
4. Pepito JA, Locsin R. Can nurses remain relevant in a technologically advanced future? International Journal of Nursing Sciences 2018;6(1):106–110. https://doi.org/10.1016/j.ijnss.2018.09.013.
5. Eriksson H, Salzmann-Erikson M. The digital generation and nursing robotics:A netnographic study about nursing care robots posted on social media. Nursing Inquiry 2017;24(2):e12165. https://doi.org/10.1111/nin.12165.
6. Song YA, Kim HJ, Lee HK. Nursing, robotics, technological revolution:Robotics to support nursing work. Journal of Korean Gerontological Nursing 2018;20(Suppl 1):144–153. https://doi.org/10.17079/jkgn.2018.20.s1.s144.
7. Aly A, Griffiths S, Stramandinoli F. Metrics and benchmarks in human-robot interaction:Recent advances in cognitive robotics. Cognitive Systems Research 2017;43:313–323. https://doi.org/10.1016/j.cogsys.2016.06.002.
8. Khader N, Lashier A, Yoon SW. Pharmacy robotic dispensing and planogram analysis using association rule mining with prescription data. Expert Systems with Applications 2016;57:296–310. https://doi.org/10.1016/j.eswa.2016.02.045.
9. McGrow K. Artificial intelligence:Essentials for nursing. Nursing 2019;49(9):46–49. https://doi.org/10.1097/01.NURSE.0000577716.57052.8d.
10. Swan BA. Assessing the knowledge and attitudes of registered nurses about artificial intelligence in nursing and health care. Nursing Economic$ 2021;39(3):139–143.
11. Douthit BJ, Hu X, Richesson RL, Kim H, Cary MP. How artificial intelligence is transforming the future of nursing:Thinking about care in a new light. American Nurse Journal 2020;15(9):100–103.
12. Davis FD. Perceived usefulness, perceived ease of use, and user acceptance of information technology. MIS Quarterly 1989;13(3):319–339. https://doi.org/10.2307/249008.
13. Venkatesh V, Davis F, Morris MG. Dead or alive?The development, trajectory and future of technology adoption research. Journal of the Association for Information Systems 2007;8(4):267–286. https://doi.org/10.17705/1jais.00120.
14. Schepman A, Rodway P. Initial validation of the general attitudes towards Artificial Intelligence Scale. Computers in Human Behavior Reports 2020;1:100014. https://doi.org/10.1016/j.chbr.2020.100014.
15. Lin JSC, Hsieh PL. Refinement of the technology readiness index scale:A replication and cross-validation in the self-service technology context. Journal of Service Management 2012;23(1):34–53. https://doi.org/10.1108/09564231211208961.
16. Parasuraman A. Technology readiness index (Tri):A multiple-item scale to measure readiness to embrace new technologies. Journal of Service Research 2000;2(4):307–320. https://doi.org/10.1177/109467050024001.
17. Venkatesh V, Morris MG, Davis GB, Davis FD. User acceptance of information technology:Toward a unified view. MIS Quarterly 2003;27(3):425–478. https://doi.org/10.2307/30036540.
18. Kim SW, Lee YJ. Development of test tool of attitude toward artificial intelligence for middle school students. The Journal of Korean Association of Computer Education 2020;23(3):17–30. https://doi.org/10.32431/kace.2020.23.3.003.
19. Kim SW, Lee YJ. Attitudes toward artificial intelligence of high school students'in Korea. Journal of the Korea Convergence Society 2020;11(12):1–13. https://doi.org/10.15207/JKCS.2020.11.12.001.
20. Sousa VD, Rojjanasrirat W. Translation, adaptation and validation of instruments or scales for use in cross-cultural health care research:A clear and user-friendly guideline. Journal of Evaluation in Clinical Practice 2011;17(2):268–274. https://doi.org/10.1111/j.1365-2753.2010.01434.x.
21. Lynn MR. Determination and quantification of content validity. Nursing Research 1986;35(6):382–386. https://doi.org/10.1097/00006199-198611000-00017.
22. Han SS, Lee SC. Nursing and health statistical analysis 2nd edth ed. Seoul: Hannarae; 2018. p. 1–520.
23. Sassis L, Kefala-Karli P, Sassi M, Zervides C. Exploring medical students'and faculty's perception on artificial intelligence and robotics. A questionnaire survey. Journal of Artificial Intelligence for Medical Sciences 2021;2(1-2):76–84. https://doi.org/10.2991/jaims.d.210617.002.
24. Loh E. Medicine and the rise of the robots:A qualitative review of recent advances of artificial intelligence in health. BMJ Leader 2018;2:59–63. https://doi.org/10.1136/leader-2018-000071.
25. Schermelleh-Engel K, Moosbrugger H, Müller H. Evaluating the fit of structural equation models:Tests of significance and descriptive goodness-of-fit measures. Methods of Psychological Research 2003;8(2):23–74.
26. Kang H. A guide on the use of factor analysis in the assessment of construct validity. Journal of Korean Academy of Nursing 2013;43(5):587–594. https://doi.org/10.4040/jkan.2013.43.5.587.
27. Lam SY, Chiang J, Parasuraman A. The effects of the dimensions of technology readiness on technology acceptance:An empirical analysis. Journal of Interactive Marketing 2008;22(4):19–39. https://doi.org/10.1002/dir.20119.
28. Fitzpatrick R, Davey C, Buxton MJ, Jones DR. Evaluating patient-based outcome measures for use in clinical trials. Health Technology Assessment 1998;2(14):i–iv. 1-74.
29. Streiner DL, Norman GR, Cairney J. Health measurement scales:A practical guide to their development and use 5th edth ed. New York: Oxford University Press; 2015. https://doi.org/10.1093/med/9780199685219.001.0001.

Article information Continued

Table 1

Characteristics of Participants (N=230)

Characteristics Categories n (%) Mean±SD
Sex Male 27 (11.7)
Female 203 (88.3)
Age (years) 24.62±6.56
School year Junior 140 (60.9)
Senior 90 (39.1)
Daily non-academic internet usage time (hours) 4.35±2.42
Purpose of internet use* (n=539) Messenger/social networking service 182 (33.8)
Game 44 (8.2)
Searching information 135 (25.0)
Watching movies/television/videos 178 (33.0)
AI education experiences Yes 46 (20.0)
No 184 (80.0)
AI education topics AI and impact on future jobs 18 (7.8)
Fundamentals of AI 12 (5.2)
Applications of AI technology 7 (3.0)
Applications of AI data science and informatics 6 (2.6)
Ethical consideration 4 (1.7)
Strength and limitations of AI 4 (1.7)

AI=Artificial Intelligence; SD=standard deviation

*

Multiple responses;

% out of 230 participants

Table 2

Item Analysis of the General Attitudes towards Artificial Intelligence Scale (N=230)

Dimensions Items Mean±SD Skewness Kurtosis ITC* Cronbach’s α if item deleted
Positive attitude 1. For routine transactions, I would rather interact with an artificially intelligent system than with a human. 3.80±0.90 -0.71 0.17
2. Artificial Intelligence can provide new economic opportunities for this country. 3.96±0.62 -0.19 0.27 .52 .85
4. Artificially intelligent systems can help people feel happier. 3.36±0.80 -0.23 -0.16 .51 .86
5. I am impressed by what Artificial Intelligence can do. 3.31±0.82 -0.15 -0.56 .62 .85
7. I am interested in using artificially intelligent systems in my daily life. 3.51±0.84 -0.47 0.32 .70 .84
11. Artificial Intelligence can have positive impacts on people’s wellbeing. 3.62±0.70 -0.08 -0.19 .61 .85
12. Artificial Intelligence is exciting. 3.81±0.81 -0.39 -0.21 .77 .83
13. An artificially intelligent agent would be better than an employee in many routine jobs. 4.10±0.68 -0.46 0.34 .62 .85
14. There are many beneficial applications of Artificial Intelligence. 4.00±0.59 0.00 -0.06 .71 .84
16. Artificially intelligent systems can perform better than humans. 3.50±0.79 -0.18 -0.40 .56 .85
17. Much of society will benefit from a future full of Artificial Intelligence 3.88±0.65 -0.17 0.04 .71 .84
18. I would like to use Artificial Intelligence in my own job. 3.46±0.78 -0.18 -0.14 .74 .83
Negative attitude 3. Organizations use Artificial Intelligence unethically. 3.09±0.72 -0.14 -0.21 .50 .74
6. I think artificially intelligent systems make many errors. 2.68±0.75 -0.02 -0.06 .48 .74
8. I find Artificial Intelligence sinister. 3.62±0.75 -0.33 -0.13 .69 .69
9. Artificial Intelligence might take control of people. 2.59±1.04 0.67 -0.26 .64 .72
10. I think Artificial Intelligence is dangerous. 2.93±0.86 0.14 -0.30 .74 .68
15. I shiver with discomfort when I think about future uses of Artificial Intelligence. 2.93±1.01 0.01 -0.78 .68 .71
19. People like me will suffer if Artificial Intelligence is used more and more. 3.50±0.88 -0.35 -0.12 .66 .70
20. Artificial Intelligence is used to spy on people. 3.17±1.06 -0.10 -0.72

GAAIS=General Attitudes towards Artificial Intelligence Scale; ITC=item-total correlation; SD=standard deviation

*

Results excluding item 1 and 20;

p<.001;

Negative items were reverse-scored

Table 3

Confirmatory Factor Analysis of the General Attitudes towards Artificial Intelligence Scale (N=230)

Dimensions Items Standardized estimates SE C.R. CCR AVE Cronbach’s α
Factor 1 (positive attitude) .99 .91 .86
2 .44
4 .41 0.25 4.74
5 .57 0.30 5.72
7 .75 0.37 6.25
11 .54 0.25 5.62
12 .77 0.36 6.46
13 .52 0.26 5.51
14 .66 0.24 6.21
16 .48 0.27 5.22
17 .70 0.27 6.27
18 .73 0.34 6.35
Factor 2 (negative attitude) .97 .84 .74
3 .41
6 .41 0.25 4.22
8 .71 0.34 5.30
9 .42 0.35 4.25
10 .72 0.38 5.47
15 .55 0.40 4.73
19 .59 0.36 4.94

Model fit: χ2 (p)=221.34 (<.001), df=128, χ2/df=1.73, GFI=.91, AGFI=.88, NFI=.84, RMR=.05, RMSEA=.06, SRMR=.07, CFI=.92, TLI=.90

AGFI=adjusted goodness of fit index; AVE=average variation extracted; χ2/df=chi-square/degree of freedom; CFI=comparative fit index; CCR=composite construct reliability; C.R.=critical ratio; GFI=goodness of fit index; NFI=normed fit index; RMSEA=root mean square error of approximation; RMR=root mean square residual; SE=standard error; SRMR=standardized root mean square residual; TLI=Tucker–Lewis index

Figure 1

Modified confirmatory factor analysis of the general attitudes towards artificial intelligence scale