0과 1을 공부하다.

[IoT] 인공지능(AI)와 사물인터넷(IoT) 융합의 필요성(Big-Data 관점에서) 본문

Study/IoT

[IoT] 인공지능(AI)와 사물인터넷(IoT) 융합의 필요성(Big-Data 관점에서)

Developer_Jay 2022. 1. 1. 12:28
728x90

1.1 서론

  4차 산업혁명시대에서 인공지능(AI), 사물인터넷(IoT), 빅데이터(Big-Data)를 빼놓고 이야기 할 수 없을 것이다. 세 가지 핵심기술이 융합되어 업무 효율과 삶의 질을 향상 시키는 기술이 발전하여 등장하였다. 특히 IoT는 연결성과 인지 능력을 넘어 개별 지능을 갖고 스스로 행동하는 자동화 과제에 직면하게 된다. 각 사물이 스스로 환경을 인지하고 판단을 내리기 위해 인공지능 기술의 필요성이 대두되게 되고 각 사물의 엑추에어터와 센서로부터 수집된 방대한 데이터를 수집/저장/처리/분석하기 위해 빅데이터 기술의 필요성이 대두되게 된다. 

 본 1장에서는 인공지능(AI) 기술과 사물인터넷(IoT) 융합의 필요성이 대두되는 이유를 Big Data 관점에서 설명하고 보안적인 측면에서 인공지능과 빅데이터의 위험성에 대해 알아보겠다. 

 

 

1.2 용어 및 개념정리

  (1) 인공지능(AI)

인공지능은 인간의 학습능력과 추론능력, 지각능력을 인공적으로 구현하려는 컴퓨터과학의 세부분야이다[1]. 인간의 학습, 추론, 지각능력을 구현하기 위해 인간의 뇌와 유사하게 모방하여 학습하게 되는데 여기서 기계학습(Machine learning) 개념과 딥러닝(Deep learning) 용어가 등장하게 된다[2]. 기계학습은 사용자가 컴퓨터에게 학습 정보를 제공하면 지도학습(Supervised learning) 또는 비지도학습(Unsupervised learning)을 하여 결과에 따른 결과를 도출하는 방식이고, 딥러닝(Deep learning)은 기계학습의 일종으로 인간이 가르치지 않아도 스스로 강화 학습(Reinforcement learning)하고 예측하여 결과를 도출하는 더욱 진화된 형태이다[2].

 

 

  (2) 사물인터넷(IoT)

사물인터넷 Internet of Things는 각종 사물에 센서와 통신 기능을 내장하여 사물들을 인터넷에 연결하는 기술을 의미한다[3]. 사물인터넷이 발전하는 형태로는 연결성 측면에서 사물과 인터넷의 연결성이 강조되었던 기술(IoT 1.0)에서 사물이 환경을 스스로 인지하는 기술(IoT 2.0), 사물이 환경을 스스로 인지하고 환경에 맞는 행동하는 자동화 단계(IoT 3.0)에 발전되었다[4]. IoT의 자동화(Autonomy) 과제를 수행하기 위해서는 센서로 받은 데이터를 수집하여 분석하는 빅데이터를 이용한 데이터 사이언스 기법과 사물의 환경을 인지하고 행동하기 위한 인공지능 학습교육이 핵심으로 중요한 기술이다.

 

 

  (3) 빅데이터(Big Data)

 빅데이터는 기존 데이터베이스 관리도구의 능력을 넘어서는 대량의 정형/비정형 데이터의 집합을 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술이다[5]. 

 빅데이터의 공통적 특징과 의미는 3V는 Veracity(정확성), Variability(가변성), Visualization(시각화)로 구분하여 표현할 수 있고, 분석기법으로는 아파치 하둡, 텍스트 마이닝, 오피니언 마이닝 등등이 있다[5]. 해당 특징과 분석 기법을 이용하여 IoT에서 수집된 방대한 데이터를 저장하고 분류하여 AI를 통해 학습하여 자율적으로 상황을 인지하고 동작하는 방식으로 발전하는데 빅데이터의 특성과 분석기법은 매우 중요한 기술이다.

 

 

 

 

 

1.3 인공지능 기술과 사물인터넷 융합의 필요성이 대두되는 이유 (Big Data 관점에서)

  앞서 용어 정리 및 개념 정리를 통해 알아보았듯이 AI, IoT, Big Data 각각의 목적을 달성하기 위해 밀접한 관계를 가지고 있다. 특히 IoT에서 자동화(Autonomy) 과제를 달성하기 위해서는 AI 기계학습 기법과 수집 된 데이터를 분석하는 Big Data 분석 기법이 융합되어야 한다. 1.3에서는 Big Data 관점에서 AI와 IoT의 융합의 필요성에 대해 알아보기 위해 사물인터넷의 발전 방향과 인공지능의 학습 방법에 간략하게 알아보고 IoT 데이터의 특성과 빅데이터 분석 기법을 바탕으로 융합의 필요성을 알아보겠다.   

 

  (1) 사물인터넷 기술의 진화

 IBM은 IoT의 발전 단계를 [그림 1]와 같이 디바이스 연결 단계(연결성, IoT 1.0), IoT 인프라 구축 단계(지능화, IoT 2.0), 산업별 혁신 솔루션 개발 단계(자동화, IoT 3.0) 등 총 3단계로 구분짓고 있다[7]. [표 1]는 IBM에서 구분한 각 단계별 추구하는 내용이다.

 

[그림 1] IoT 발전 단계[6]

   
IoT 1.0 (연결성) - IoT 초기 단계로 사물과 인터넷 연결 기술이 중심임.
  • 네트워크에 연결된 사물의 기능 혹은 정보가 제한적으로 수집된 데이터를 모니터링하는 수준임.
IoT 2.0 (지능형)
  • IoT 중기 단계로 사물과 인터넷이 연결되어 주변 환경을 센싱하여 사물이 스스로 환경을 인지하고 인식하는 수준임.
  • 이전 단계와 다르게 사물에 파라미터를 전달하여 엑추에이터나 센서를 제어할 수 있고 사물이 데이터를 통해 주변 환경을 인지하여 자동으로 행동하는 것처럼 보여지는 단계임.
IoT 3.0 (자동화)
  • IoT 3.0 단계는 IoT 단계에서 더욱 진보하여 사물이 환경을 인지 및 인식하여 스스로 행동하는 단계임.
  • IoT에서 나온 데이터(Big Data)를 바탕으로 데이터를 분석(Data Analysis)하고 학습(AI Learning)하는 단계임.

 

 

 

 앞서 IoT의 발전 단계를 알아보았듯이 IoT는 초기 사물 연결중심에서 지능형, 자동화 단계까지 발전하였다. IoT 자동화 단계에서는 사물이 환경을 스스로 인식하고 행동하기 위해 Big Data 기반의 Data Analysis를 수행하여 데이터 특징을 분석해야 하고 AI 기계학습을 통해 사물이 인식 가능한 상태로 학습되어야 한다. 

 

 

  (2) 인공지능의 학습 방법

 인공지능은 사람의 인지, 추론, 지각 등 사람의 행동 양식과 유사하게 구현하는 기술로서 인공지능의 학습방법으로는 기계학습(Machine Learning)이 존재한다. 기계학습에서 학습 방법은 대표적으로 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)가 있다[8]. [표 2]는 학습방법에 대한 설명이다. 

 

학습 방법  
지도 학습
  • 데이터에 태그를 붙여 학습시키는 방법.
  • 예컨대 강아지 이미지에 ‘dog’라는 태그를 부착하여 AI가 해당 이미지가 강아지라는 사실을 학습하는 방법.
  • 많은 학습데이터를 통해 학습 할 경우 높은 정확도를 보이지만 새로운 환경에 쉽게 적응하지 못하는 특성을 가짐.
비지도 학습
  • 데이터의 유사도를 분석하여 유사한 데이터끼리 군집을 이뤄 학습하는 방법.
  • 예컨대 강아지와 고양이 사진을 주었을 때 강아지와 유사한 사진은 강아지 군집으로 고양이와 유사한 사진은 고양이 군집으로 학습하여 분류하는 특성을 가짐. 
강화 학습
  • 강화학습은 입력 데이터를 바탕으로 결과를 평가하여 지속적으로 환경에 따른 결과를 평가하여 진화하여 학습하는 방법.
  • 예컨대 아기가 태어나 모든 것을 행동하고 맛보고 느껴 스스로 깨우치는 것과 같은 특성을 지님.

 

 

 [표 2]를 바탕으로 유추하자면 지도학습, 비지도학습, 강화학습 순으로 구현 알고리즘이 복잡하나 스스로 환경에 적응하여 학습하기 때문에 새로운 환경에서 적응하기 유리하다. 해당 특징을 바탕으로 IoT에 적용하였을 때 환경이 자주 변화하는 특성을 고려하였을 때 강화 학습을 수행하는 것이 유리하겠지만 IoT의 리소스를 고려하면 복잡한 알고리즘일수록 Real-Time과 거리가 멀어지기 때문에 단순한 알고리즘을 가진 지도 학습을 고려 해볼 수 있다.

 

 

  (3) 빅데이터의 특징과 분석 기법

 빅데이터의 공통적인 특징으로 3V 새로운 속성들이 추가되어 4V, 5V, 7v로 추가되는 추세이다. [표 3]은 7V의 특성을 정리한 표이다[9]. 공통적인 3V 측면에서 빅데이터는 물리적인 방대한 자료의 양을 가지며, 고도화된 실시간 처리 능력과 정형 또는 비정형화 된 다양한 데이터의 유형을 갖는다. 이러한 특징이 일정한 양을 갖으며, 비교적 느린 정형화된 데이터를 다루는 데이터 베이스랑은 차별화된 특징을 가지고 있다.

 

   
Volume(크기)
  • 물리적 데이터의 양
Velocity(속도) - 데이터의 고도화된 실시간 처리
Variety(다양성)
  • 정형 / 비정형 다양한 데이터의 유형
Veracity(정확성)
  • 분석한 데이터의 신뢰성.
Value(가치)
  • 가치 있는 데이터의 저장. 
Variability(가변성)
  • 자신의 의도와 다르게 표현이 다르게 해석 될 수 있음.
Visyualization
(시각화)
  • 가공된 데이터의 이해할 수 있게 쉽게 표현.

 

 

 

이러한 빅데이터는 다양한 분석 기법을 이용하여 가치(Value) 있는 데이터를 실현하기 위해 이용되는데, [그림 2]와 같이 다양한 분석 및 처리기술을 이용한다. 성능이 향상된 PC를 이용하여 정형 / 비정형 구분 없이 가치있는 데이터로써 활용되기 위해 연관 규칙 학습(Association Rule Learning), 분류(Classification), 군집화(Clustering), 회귀 분석(Regression)을 수행한다[9].

 

 

[그림 ] 빅데이터 분석 및 처리기술 목록[10]  

 

 

  (4) 융합의 필요성이 대두되는 이유

  앞서 알아보았듯이 IoT 3.0은 사물이 스스로 인지하고 행동하는 자동화 목적을 가지고 있다. IoT의 자동화를 달성하기 위해서는 사물이 센서 데이터를 바탕으로 스스로 학습하여 환경에 대해 인지하고 행동하는 인공지능 학습이 필수적으로 융합되어야 한다.

 또한 IoT와 융합된 인공지능의 학습의 정확도는 많은 학습데이터로 학습을 수행할 때 더 높은 결과를 기대할 수 있으며, IoT의 정형 또는 비정형화 된 데이터를 바탕으로 학습하기 위해 빅데이터 처리 기법으로 데이터를 분석하고 처리함이 필요하다. 

 즉, IoT와 AI의 융합의 필요성 측면에서 빅데이터는 IoT의 적시적인 순간에 정보를 처리하는 Real-Time 특성과 자동화를 위해 학습하는 AI의 정확도를 위해 데이터를 분석하여 가치있는 데이터를 창출해 학습데이터로 제공해야 한다.

 

 

 

1.4 보안 이슈

  1.4 보안 이슈에서는 필자의 연구와 경험을 바탕으로 IoT와 인공지능이 융합된 환경에서의 보안 위협에 대해 알아본다. IoT, 인공지능, Big Data의 보안 위협 유형은 다양하고 광범위 하지만 필자의 대표적인 경험을 바탕으로 데이터 보안 측면(랜섬웨어), 인공지능 사이버 공격 가능성에 대해 알아본다.

 

  (1) 데이터 보안 측면

 앞서 알아보았듯이 IoT에서는 다양하고 많은 데이터를 발생시키고 자율형 IoT 과제 달성을 위해 발생시킨 데이터를 분석하고 학습한다. 학습 데이터 혹은 각종 센서 데이터는 별도의 스토리지를 통해 저장을 수행하게 되는데 해당 데이터는 기업 및 단체에서 매우 중요한 자산이 된다. 이때의 보안 위협은 데이터 보관 과정에서 저장 데이터 공격의 위협을 예측할 수 있으며, 공격 유형으로는 데이터를 암호화하여 금전적 지불을 요구하는 사이버공격 형태인 랜섬웨어를 대표적으로 들 수 있다.

 

 필자는 학부시절 복수전공으로 정보보호를 공부하였지만 부끄럽게도 혼자 사용한다는 안일한 생각으로 보안수칙을 준수하지 않아 랜섬웨어에 감염되는 사례가 있었다. 랜섬웨어에 감염된 데이터는 사전에 다른 경로로 백업된 데이터라서 피해를 최소한으로 입었지만 기업의 자산의 되는 중요한 데이터가 피해를 입었다면 금전적, 시간적 피해는 상상 이상으로 예측할 수 있다.

 

 랜섬웨어 피해는 간단한 보안 설정으로 사전에 예방이 가능한데 필자가 랜섬웨어 피해를 입고 향후 공격을 방지하기 위해 설정했던 항목들은 [표 4]과 같다.

 

설정 내용  
모니터링 서비스 이용 로그분석, 이상징후 탐지 시 알람기능을 이용하여 공격징후를 감지하고 대응하기 위함.
관리자 계정(Admin or root) 비활성화 및 비밀번호 변경 모든 권한을 갖고 있는 관리자 계정을 공격자가 접근하지 못하게 하기 위함.
방화벽 설정 방화벽 내 정책설정을 통해 공격 가능성이 있는 규칙을 배제하여 보안성을 높이기 위함.
로그인 시도 횟수 설정 서버 관리 이외에도 서비스 운영 측면에서 로그인 시도 횟수를 설정하고 차단하여 무작위 대입공격(Brute foce)로부터 보호하기 위함.
사용하지 않는 서비스 비활성화(Disable) telnet, ssh 등 사용하지 않는 서비스는 비활성화하여 공격자가 공격 가능한 경로를 사전에 차단하기 위함.
주기적인 보안 업데이트 수행 주기적인 보안 업데이트를 통해 새롭게 추가되는 n데이 취약점을 사전에 차단하기 위함.
공유폴더의 적절한 권한 부여 내부자의 공격 혹은 탈취된 내부자의 계정으로부터 공격을 방어하기 위해 사전에 사용자에게 적절한 권한을 부여하여 공격을 방지하기 위함.

 

 

 

 

  (2) 인공지능 사이버 공격 가능성

 인공지능은 학습 데이터를 통해 학습을 수행한다. 앞서 데이터 보안 측면에서 보았듯이 학습데이터는 중요한 정보 자산이다. 이를 악의적으로 오염시키는 공격 기법으로 대표적으로 교사 데이터 독살(Training Set Poisoning)을 꼽을 수 있다. 필자는 정보보호학과 학사학위 논문으로 인공지능의 공격 위험성 분석[12]을 저술하였다. 본 내용을 바탕으로 인공지능의 악의적 데이터 오염 가능성을 알아보겠다.

 

 실험 환경은 Google Brain팀에서 개발한 TensorFlow 오픈소스 라이브러리를 이용하여 0부터 9에 해당되는 숫자 이미지 데이터를 10,000회 학습시켰다.

 

 [그림 0]과 같이 10% 이하의 잘못된 태그가 부착된 데이터가 포함 되었을 경우에는 100%의 정확도를 보였지만 [그림0]과 [그림 0]과 같이 잘못된 태그가 부착된 데이터가 15% ~ 20% 경우 숫자 0과 8, 9 오인하는 결과를 보였다[12].

 

 

[그림 3]    잘못된 태그가 부착된 데이터가 0 ~ 10% 이하인 경우[12]

 

[그림 4] 잘못된 태그가 부착된 데이터가 15%인 경우[12]

 

[그림 5] 잘못된 태그가 부착된 데이터가 20%인 경우[12]

 

 

1.5 결론 및 견해

  본 과제를 통해 인공지능 기술과 사물인터넷 융합의 필요성이 대두되는 이유를 Big Data 관점에서 알아보았다. 사물인터넷 3.0에 해당하는 사물의 자동화를 달성하기 위해서는 AI의 학습능력이 필요하며, AI의 정확도 향상을 위해서는 IoT의 정형/비정형화 된 데이터를 빅데이터의 다양한 분석기술을 이용하여 가치 있는 데이터를 분류 및 처리 한다. 또한 적시적인 순간에 데이터를 제공하기 위해 빅데이터는 신뢰성있고 높은 속도를 보장하게 됨을 결론 지었다. 추가로 IoT와 AI가 융합된 환경에서 AI를 학습하기 위한 방대한 데이터와 인공지능의 악의적 데이터 오염에 대한 보안 이슈를 알아보았다. 

 본 과제에 대한 개인적인 견해는 AI, IoT, BigData 각 기술의 발전에 있어 서로 상호간에 연계되어 매우 중요하다고 생각한다. 특히 IoT 중점으로 봤을 때 사물의 자율성을 바탕으로 스스로 행동하게 함으로써 IoT의 통신과정에서의 보안, AI의 학습 데이터 보안 등 보안적인 측면도 함께 발전하고 위협을 사전에 대응해야 한다고 생각한다. 또한 지능형 사물에 대한 윤리적인 문제와 개인정보 및 사생활 측면에서도 문제점을 고려하여 해결해야 한다고 생각한다.

 

 

1.6 참고문헌

[1] 위키피디아 – AI

 

[2] 네이버 지식백과 – AI-ML-DL(https://terms.naver.com/entry.naver?docId=3473235&cid=58439&categoryId=58439) 

 

[3] 위키피디아 – Internet of Things

 

[4] 아주대학교 정보통신대학원 IoT 개론 36차시 (IoT Intelligence)

 

[5] 위키피디아 – Big Data

 

[6] IBM GTO 2014

 

[7] 미래창조과학부 정보통신정보화 및 정책지원 사업(IT통계조사 및 동향분석)의 연구결과

 

[8] 아주대학교 정보통신대학원 IoT 개론 35차시 AI and Machine Learning

 

[9] 전국과학관 길라잡이<빅데이터의 속성 3V, 4V, 5V> (https://smart.science.go.kr)

 

[10] elec4 - 빅데이터 시장동향과 분석기법 (https://www.elec4.co.kr/article/articleView.asp?idx=10458)

 

[11] 박지환 블로그 시놀로지 NAS 보안성 향상을 위한 설정 (https://developerjaypark.tistory.com/22)

 

[12] 인공지능의 공격 위험성 분석(2018/고강문, 박지환/순천향대학교 정보보호학과 학사학위 논문)

 

 

※ 본 게시물은 아주대학교 정보통신대학원 과제수행 자료 입니다. 해당 대학교의 과제수행 목적을 위한 인용을 금합니다.

※ 본 게시글의 정보가 잘못 되었거나 부족한 부분에 대한 피드백을 환영합니다.

 

* CopyRight 2021. Jay Park All rights reserved.

 

728x90
Comments