SInce 20180106

  • 홈
  • 태그
  • 방명록
  • 글쓰기

임베딩의 의의 1

1. 임베딩이란

1. 임베딩의 정의 컴퓨터는 인간이 사용하는 자연어(Natural Language)를 있는 그대로 이해할 수 없다. 따라서, 우리는 컴퓨터가 글자데이터를 분석할 수 있도록, 글자를 숫자형 데이터로 변형하여 전달해야 한다. 기계가 이해할 수 있는 숫자의 배열은 벡터라고도 하기 때문에, 일반적으로 문자를 숫자로 변환하는 과정을 '벡터화한다' 혹은 '워드를 임베딩한다'라고 말한다. 임베딩의 형태는 크게 두가지가 있다. 1) 희소표현 (Sparse Representation Matrix) One-Hot encoding을 통해, 코퍼스에 사용된 단어에 인덱스번호를 부여하고 해당 단어를 인덱스값으로 치환하는 방식이다. 즉, 10000개의 단어가 있다면 벡터는 10000차원의 데이터가 된다. ex) 코퍼스의 사이즈가..

Python/NLP(자연어처리) 2020.09.01
이전
1
다음
더보기
프로필사진

그냥...

  • 전체보기 (160)
    • Git과Github (1)
    • Python (33)
      • 기초 (9)
      • IDE, 버전관리, 도커 (8)
      • Numpy (3)
      • Pandas (5)
      • Tensorflow & Keras (1)
      • NLP(자연어처리) (5)
      • NLP+Pytorch (2)
    • 선형대수(Linear Algebra) (105)
    • 알고리즘 (1)
    • BlockChain (3)
    • 여행기 (13)
      • 중국, 러시아(18.1.12~1.26) (4)
      • 일본(다카마쓰, 23.4.29~5.2) (4)
      • 중국(광저우, 둥관, 포산, 23.06.03~06.. (5)
    • 여러 책들 후기 (2)
    • Kali Linux (2)

Tag

기저변환, Python, 고유값, 선형변환, 기저, 정규직교기저, 행렬식, 가역성, 선형독립, 영공간, 열공간, 파이썬, 정사영, 선형대수, 선형대수학, 변환행렬, 부분공간, 정규직교집합, 고유벡터, linear algebra,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 디자인도 그지같다
  • 가독성은 떨어진다

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바