728x90 머신러닝5 인공지능을 위한 수학 - 6. 자연어 처리 6-1 자연어 처리로 문서의 카테고리 알아맞히기자연어 처리 (Natural Language Processing, NLP): 사람이 사용하는 언어(텍스트·음성)를 컴퓨터가 이해하고 처리하도록 돕는 AI 기술입니다.자연어는 어떻게 다루는가? 텍스트를 형태소나 단어 단위로 나눈 뒤 수치 벡터로 변환해 기계가 분석하도록 합니다.특징 추출과 학습 과정에서는 어떤 일이 벌어질까? 각 문서에서 의미 있는 단어(feature)를 뽑아 벡터로 만들고, 이를 머신러닝 모델에 학습시켜 카테고리를 예측하게 합니다.정답률은 어느 정도 수준인가? 데이터 품질과 모델에 따라 다르지만, 일반적으로 70~90%의 정확도를 기대할 수 있습니다.6-2 카테고리별 데이터 세트– 스포츠, 정치, 경제와 같은 주제별 라벨이 붙은 문서 모음입니.. 독서(Reading)/인공지능을 위한 수학 2025. 6. 12. 인공지능을 위한 수학 - 5. 선형회귀 5.1 회귀 모델로 주택 가격 추정하기선형회귀모델입력 변수와 출력 변수 사이의 선형적인 관계를 모델링하는 기법입니다.단순회귀분석 (Simple Regression Analysis)설명변수가 하나인 경우에 사용하는 선형회귀 분석입니다.다중회귀분석 (Multiple Regression Analysis)설명변수가 여러 개인 경우의 회귀분석입니다.목적변수 / 종속변수예측하고자 하는 대상 변수입니다. 예: 주택 가격설명변수 / 독립변수결과에 영향을 주는 입력 변수들입니다.선형성 (Linearity)입력과 출력 사이의 관계가 직선(선형)으로 표현될 수 있음을 뜻합니다.바이어스 (Bias)예측값과 실제값 간의 차이를 의미합니다. 높은 바이어스는 부정확한 예측을 나타냅니다.5.2 데이터 세트 'Boston Housin.. 독서(Reading)/인공지능을 위한 수학 2025. 6. 7. 인공지능을 위한 수학 - 4. 확률과 통계(2nd) 📊 기초 통계 개념 정리 (수식 포함)1. 평균 (Expectation)어떤 값들이 있을 때, 그 값들의 중심이 어디쯤인지 나타내는 값입니다. 전체 데이터를 더한 뒤 개수로 나누어 구합니다.$$\mu = \frac{1}{n} \sum_{i=1}^{n} x_i$$2. 편차 (Deviation)각 데이터가 평균에서 얼마나 떨어져 있는지를 나타냅니다. 양수면 평균보다 크고, 음수면 평균보다 작다는 뜻입니다.$$\text{편차} = x_i - \mu$$3. 분산 (Variance)모든 데이터의 편차를 제곱해 평균을 낸 값으로, 데이터가 평균에서 얼마나 퍼져 있는지를 나타냅니다.$$\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2$$4. 표준편차 (Standard De.. 독서(Reading)/인공지능을 위한 수학 2025. 6. 6. 인공지능을 위한 수학 - 3. 선형대수 🔢 선형대수와 벡터 기초✅ 선형대수벡터, 행렬, 선형변환 등을 다루는 수학 분야.데이터와 공간을 수학적으로 표현하고 계산하는 데 필수!✅ 벡터와 스칼라벡터: 방향과 크기를 가진 수 (예: [3, 4])스칼라: 크기만 있는 숫자 (예: 5, -2)✅ 스칼라배벡터에 숫자(스칼라)를 곱해 크기를 바꾸는 연산. 방향은 그대로.🧮 벡터 연산✅ 내적 (Dot Product, 스칼라곱)두 벡터의 방향 유사성을 측정. 결과는 숫자(스칼라).직각이면 0, 같은 방향이면 양수.✅ 외적 (Cross Product, 벡터곱)3차원에서만 가능. 두 벡터에 수직인 새로운 벡터를 만들어냄.✅ 영사곱한 벡터를 다른 벡터 위에 "그림자처럼" 눕혀 겹치는 정도를 보는 것.✅ 텐서곱두 벡터를 곱해 고차원 행렬(텐서)을 만드는 연산.?.. 독서(Reading)/인공지능을 위한 수학 2025. 5. 14. 텐서플로(TensorFlow)란 무엇인가? 기초 개념과 활용 방법 1. 텐서플로(TensorFlow)란?텐서플로(TensorFlow)는 구글 브레인 팀에서 개발한 오픈소스 머신러닝 및 딥러닝 프레임워크입니다. 텐서(Tensor)와 플로우(Flow)라는 이름에서 알 수 있듯이, 데이터를 텐서라는 다차원 배열로 표현하며 이 텐서의 흐름을 정의하고 계산하는 그래프 기반의 구조를 사용합니다. 이는 인공지능, 자연어 처리, 이미지 인식 등의 다양한 분야에서 광범위하게 사용됩니다.2. 텐서플로의 특징확장성: 대규모 분산 시스템부터 모바일 기기까지 다양한 플랫폼에서 실행 가능.유연성: 사용자 정의 가능한 신경망 구조를 쉽게 구성할 수 있음.오픈소스: 누구나 무료로 사용 가능하며, 커뮤니티가 활발하게 발전 중.멀티 언어 지원: Python을 중심으로, C++, JavaScript, .. 프로그래밍공부(Programming Study)/머신러닝(Machine Learning) 2024. 8. 16. 이전 1 다음 728x90