본문 바로가기

마구잡이 정리

시맨틱 웹을 위한 요소 기술 - 인공지능편

1. 머리말

ㄴ웹 3.0을 실현하는 두 가지 핵심 기술로 시맨틱 웹과 인공지능을 들 수 있다.

ㄴ시맨틱 웹과 웹 3.0을 구분하지 않고 사용하는 경우도 있지만, 보다 정확히 말하자면 시맨틱 웹이 먼저 제시되고, 웹 3.0

    이 뒤이어 제안되면서 먼저 나온 시맨틱 웹 개념이 포괄하게 된 것으로 볼 수 있다.

ㄴ시맨틱 웹이 제안될 당시, 인간의 언어를 컴퓨터가 이해하도록 하자는 핵심 개념이 인공지능 진영의 기술 발전 방향과 일

    치했기 떄문에 이 두 가지 기술이 함께 묶여서 거론되곤 했다.

ㄴ초기에는 시맨틱 웹이나 인공지능 기술 모두가 큰 성공을 이루지 못했기 떄문에 두 기술 모두에 대해 업계의 반응은 냉담

    했다. 하지만 시맨틱 웹의 방향성 자체는 의미가 있었고 지속시킬 만 한 가치가 있었기 때문에 웹 3.0 이라는 좀 더 포괄

    적인 개념으로 이어져 왔다.

ㄴ웹 3.0은 버너스 리가 제안했던 시맨틱 웹이라는 본래의 개념보다 훨씬 확장되고 진보된 개념으로 볼 수 있으나, 웹 3.0

    의 구체적 양상을 논하기 위해서는 그 핵심 요소인 시맨틱 웹과 인공지능에 대해 살펴보는 것이 바람직하다.

 

2. 시맨틱 웹 개요

ㄴ시맨틱 웹은 특정 문서나 애플리케이션을 연결하기보다는 그 내용과 의미 자체를 연결하는 방법을 제시한다.

ㄴ어떤 구체적인 정보를 참조할 때 그 정보가 포함된 문서나 애플리케이션을 가리키는 것이 아니라 정보 자체를 가리키는

    방식이다.

ㄴ해당 정보가 변경 또는 갱신되더라도 별도로 작업을 추가할 필요가 없다는 장점이 있다.

ㄴ보다 근본적으로 시맨틱은 '의미' 또는 '이해'의 문제를 해결하고자 하는 기술이며, 구체적인 세부 기술로는 자연어 처리

    (Natural Language Processing)나 시맨틱 검색 등이 포함된다.

ㄴ시맨틱 웹 기술이 다른 데이터 관련 기술과 다른 점은 데이터의 구조가 아니라 데이터의 의미에 집중한다는 것이다.

ㄴ대량의 데이터를 다수의 소스로부터 참조해야 하는 애플리케이션을 개발해야 한다면, 시맨틱 웹 기술이 매우 유용하다.

 

3. 시맨틱 웹의 목표

ㄴ시맨틱 웹의 목표는 컴퓨터로 하여금 문서의 내용을 구성하는 엔티티를 이해할 수 있도록 하는 것이다.

ㄴ시맨틱 웹은 웹 페이지를 구성하는 단순 구조물로 존재하는 데이터에 의미를 부여하고, 데이터 간에 관계를 형성해 준다.

ㄴ검색엔진을 예로 사용자가 검색하려는 키워드가 문맥에 따라 다른 의미를 가지고 있을 경우, 대상 검색 엔진이 사용자의

    의도를 이해하고 있다면 그에 맞는 정확한 결과만 신속하게 산출해줄 것이다.

ㄴ그렇지 못한 경우는 불필요한 검색 결과도 다수 포함하게 되는데,

ㄴ시맨틱 웹은 컴퓨터가 언어의 의미를 파악하도록 구현되기 때문에 검색 과정에 사용되는 키워드에 대해서도 문맥을 이

    해하고, 상황에 맞는 검색 결과를 산출하는 것이 가능해진다.

ㄴ더 나아가, 해당 키워드로 검색하는 의중을 이해할 수 있기 때문에 이와 연관된 또는 이에 이어지는 후속 사건들을 예측

    하고 적절히 대응할 수 있게 된다.

 

4. 인공지능과 시맨틱 웹

ㄴ웹 영역이 점차 확잗외고 웹 기술도 급격히 발달하면서 시맨틱 정보를 기술해야 할 대상 영역도 폭발적으로 증가했다.

ㄴ시맨틱 웹을 실현하기 위한 실천 전략으로는 상향식(Bottom-up) 접근 방식과 하향식(Top-down) 접근 방식이 주로 거론된다.

 

ㄴ상향식 접근법은 인터넷에 존재하는 기존의 모든 문서에 정보를 추가하여 기계가 이해할 수 있는 전략이다.

ㄴ상향식 접근법의 경우 온톨로지 구조가 너무 복잡해지거나, 일관성을 잃기 쉽다.

ㄴ온톨로지를 구축하는 작업은 ER 모델에 기반한 DB 스키마 설계보다 훨씬 어렵고, 복잡한 과정을 거쳐 만들어지기 떄문

    이다.

 

ㄴ하향식 접근법은 지금 현재 상태의 웹사이트에 담겨있는 데이터를 더 잘 이해할 수 있는 애플리케이션을 개발하는 방식

    을 택한다.

ㄴ잘 정리된 온톨로지 구조를 확보할 수 있다는 장점은 있지만, 작성자의 경험에 의존해야 하고 적용 범위가 제한적일 수

    밖에 없다는 단점을 가진다.

ㄴ하향식 접근법을 선호하는 사람들은 상향식 접근법이 웹 3.0에 전혀 들어맞지 않는다는 점을 지적하며, 인터넷에 존재하

    는 모든 웹사이트나 텍스트에 정보를 추가하여 기계가 이해할 수 있도록 설명을 더하는 일은 물리적으로 가능하지 않다

    는 입장이다.

 

ㄴ또 다른 방식으로는 생산자(Producer)와 소비자(Consumer)의 관점에서 시맨틱 웹 구현 문제에 접근하는 방안을 생각할

    수 있다.

ㄴ생산자 입장에서는 시맨틱 태그를 자동으로 달아주는 자동 주석기(Sematic Annotator) 형태의 접근 방식이 있다.

ㄴ이 기술은 자연어 처리 기술에 크게 의존하지 않기 때문에 초기의 결과가 만족스럽지 않았는데, 최근 이 분야의 기술이

    비약적으로 증가하면서 시맨틱 웹 구현을 위해 여러 측면에서 활용가능한 수준에 이르렀고, 인간의 언어 생성 능력에

    필적할 수준으로 문장을 만들어 내는 딥러닝 모델들이 개발되고 있으므로, 이를 활용한 자동 태깅 기능이 실형될 가능

    성이 높다.

 

ㄴ소비자 입장에서는 현재 웹이 완전히 시맨틱 웹으로 전환된 것이 아니기 때문에 다양한 수준의 웹 페이지들을 이해할

    수 있는 기능이 필요하다.

 

5. 시맨틱 웹과 개인화

ㄴ시맨틱 웹의 개인화 측면을 담당하는 표준으로 APML(Attention Profile Markup Language)이라는 마크업 언어 표준이

    있다.

ㄴAPML은 사용자 프로파일을 기술할 때 사용하는 언어이다.

ㄴAPML로 기술된 사용자 프로파일에는 개인의 관심사나 기호가 기록되며 이 정보는 사용자가 접촉하는 웹 사이트와 그

    안에 데이터를 필터링하는데 사용된다.

 

6. 시맨틱 웹과 클라이언트 기반 딥러닝

ㄴ웹 3.0, 그리고 시맨틱 웹의 대표 플랫폼은 웹 브라우저이다.

ㄴ브라우저 중에서도 데스크탑용 보다는 이동단말용 브라우저의 사용율이 더 높다.

ㄴ이동단말용 브라우저에 시맨틱 웹을 구현하기 위해서는 이동단말의 한정된 자원을 효율적으로 이용할 수 있는 인공지능

    프레임워크를 사용해야 한다.

ㄴ현재 각광받고 있는 프레임워크는 텐서플로우 라이트(TFLite)와 Tensorflow.js가 각광받는 프레임워크이다.

ㄴTFLite는 이동단말 자체에 설치되고 작동되는 애플리케이션을 구현하는 방식이고, Tensorflow.js는 웹 사이트에 모델을

    적재하여 브라우저에서 구현하는 방식이다.

 

ㄴ보완해야 할 몇 가지 단점에도 불구하고 브라우저 기반의 딥러닝 모델 구현 방식은 시맨틱 웹으로 가기 위해 반드시 건너

    야 할  가장 중요한 길목에 위치한 것으로 보인다.

ㄴ대부분의 개인화 관련 정보는 사용자 단말을 통해 수집된다는 점도 단말의 스크린이 시맨틱 웹과 사용자가 만나는 최대

    접점이 될 것이란 전망을 뒷받침한다.

 

7. 맺음말

ㄴ웹 3.0은 소셜 미디어, 스트리밍, 온라인 쇼핑 등으로 대표하는 웹 2.0의 성공을 계승하고 이를 능가하는 기술로서 잠재

    력을 인정받고 있다.

ㄴ새로운 애플리케이션의 출시를 촉진하고, 사용자와 서비스 간 상호작용의 구조와 방식을 향상 시키기 위해 시맨틱 웹, 인

    공지능, 기계학습 등 웹 3.0의 핵심 구성 요소들을 적극 융합하고 활용해야 할 필요가 있다.

'마구잡이 정리' 카테고리의 다른 글

웹 2.0과 웹 3.0 비교  (0) 2023.06.22
웹 3.0 표준화 현황과 전략 방향  (0) 2023.06.16
웹 3.0 이란  (2) 2023.06.15