일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- NLP
- 카카오
- 머신러닝
- 데이터사이언티스트
- 데이터분석
- 후기
- 자연어처리
- AIFFEL
- 제어문
- 파이썬코딩도장
- AI
- 스크랩
- 사이킷런
- 제로베이스 데이터사이언스
- 딕셔너리
- 파이썬
- 기사
- TensorFlow
- Set
- 함수
- 속성
- 코딩도장
- numpy
- 딥러닝
- 클래스
- 데이터사이언스 스쿨
- 아이펠
- 추천시스템
- Python
- 재귀함수
- Today
- Total
목록자연어처리 (2)
뮤트 개발일지
뉴스 요약봇 만들기 추출적 요약 Extractive Summarization 원문에서 문장들을 추출해서 요약하는 방식이다. 추출된 문장들 간의 호흥이 자연스럽지 않을 수 있는데, 이 때 텍스트랭크(주로 머신러닝 방식에 속함)와 같은 알고리즘을 사용한다. 원문을 구성하는 문장 중 어느 것이 핵심문장인지 판별한다는 점에서 문장 분류 문제로 볼 수 있다. 추상적 요약 Abstractive Summarization 원문으로부터 내용이 요약된 새로운 문장을 생성한다. 자연어 처리 분야 중 자연어 생성Natural Language Generation,NLG 영역이다. 추상적 요약 해보기 데이터 준비 NLTK(Natural Language Toolkit)를 사용 영어, 기호, 통계, 자연어 처리를 위한 라이브러리이다..
시퀀스 데이터: 나열된 데이터, 각 요소들이 동일한 속성을 띌 필요가 없으며 어떤 기준에 따라 정렬되어 있지 않아도 된다. https://kukuta.tistory.com/310 [Python] 시퀀스 자료형 #1 리스트(list) 파이썬에선 값이 연속적으로 이어진 자료형들을 총칭하여 "시퀀스 자료형(sequence type)"이라고 부른다. 이번 강좌에서는 파이썬의 시퀀스 자료 구조 중의 하나인 리스트에 대해 알아 본다. 기본적 kukuta.tistory.com 순환신경망 RNN 토큰으로 시작하여 생성된 단어를 다시 input하는 방식, 로 끝난다. tk.keras.preprocessing.test.Tokenizer: 텐서플로우가 제공하는 모듈(패키지), 정제된 데이터를 토큰화하고, 단어 사전을 만들어..