728x90 독서(Reading)/오늘의 책(Today's book)28 인공지능을 위한 수학 - 6. 자연어 처리 6-1 자연어 처리로 문서의 카테고리 알아맞히기자연어 처리 (Natural Language Processing, NLP): 사람이 사용하는 언어(텍스트·음성)를 컴퓨터가 이해하고 처리하도록 돕는 AI 기술입니다.자연어는 어떻게 다루는가? 텍스트를 형태소나 단어 단위로 나눈 뒤 수치 벡터로 변환해 기계가 분석하도록 합니다.특징 추출과 학습 과정에서는 어떤 일이 벌어질까? 각 문서에서 의미 있는 단어(feature)를 뽑아 벡터로 만들고, 이를 머신러닝 모델에 학습시켜 카테고리를 예측하게 합니다.정답률은 어느 정도 수준인가? 데이터 품질과 모델에 따라 다르지만, 일반적으로 70~90%의 정확도를 기대할 수 있습니다.6-2 카테고리별 데이터 세트– 스포츠, 정치, 경제와 같은 주제별 라벨이 붙은 문서 모음입니.. 독서(Reading)/오늘의 책(Today's book) 2025. 6. 12. 인공지능을 위한 수학 - 5. 선형회귀 5.1 회귀 모델로 주택 가격 추정하기선형회귀모델입력 변수와 출력 변수 사이의 선형적인 관계를 모델링하는 기법입니다.단순회귀분석 (Simple Regression Analysis)설명변수가 하나인 경우에 사용하는 선형회귀 분석입니다.다중회귀분석 (Multiple Regression Analysis)설명변수가 여러 개인 경우의 회귀분석입니다.목적변수 / 종속변수예측하고자 하는 대상 변수입니다. 예: 주택 가격설명변수 / 독립변수결과에 영향을 주는 입력 변수들입니다.선형성 (Linearity)입력과 출력 사이의 관계가 직선(선형)으로 표현될 수 있음을 뜻합니다.바이어스 (Bias)예측값과 실제값 간의 차이를 의미합니다. 높은 바이어스는 부정확한 예측을 나타냅니다.5.2 데이터 세트 'Boston Housin.. 독서(Reading)/오늘의 책(Today's book) 2025. 6. 7. 실용주의 프로그래머(The Pragmatic Programmer) - Topic 20~22 『실용주의 프로그래머』 3장 기본 도구🧠 Topic 20 디버깅디버깅은 단지 문제 풀이일 뿐이라는 사실을 받아들이고, 그런 마음으로 공략하라.→ 감정을 배제하고 문제 해결에 집중하자.기술의 전당에서는 남을 비난하기보다 문제를 고치는 데에 집중해야 한다.→ 탓하지 말고 해결에 집중하라.'하지만 정말 그럴 리가 없는데.'로 시작하는 생각의 흐름에 신경 세포 하나도 낭비하지 말라.→ 불필요한 의심은 시간 낭비다.표면에 보이는 증상만 고치려는 욕구를 이겨 내라.→ 근본 원인을 찾아라.겉으로 드러난 특정한 증상만 고치려고 하지 말고, 항상 문제의 근본 원인을 찾으려고 노력하라.→ 증상이 아닌 원인을 진단하라.처음에 받은 자료 이상을 얻기 위해서 버그를 보고한 사용자를 인터뷰할 필요도 있다.→ 사용자와 소통해 더.. 독서(Reading)/오늘의 책(Today's book) 2025. 6. 6. 실용주의 프로그래머(The Pragmatic Programmer) - 2일차 『실용주의 프로그래머』를 읽으면서 밑줄 긋고 싶었던 문장들을 모아봤다. 실용적인 팁을 넘어서, 일하는 태도나 사고방식까지 다시 돌아보게 만드는 구절들이 많았다.개발자로 살아가는 하루하루 속에서 문득 떠올리면 좋은 말들.📌 답은 언제나 추정일 뿐"모든 답은 추정치다. 단지 어떤 답이 다른 답보다 좀 더 정확할 뿐이다."→ 추정이라는 걸 인정하는 데서부터 진짜 계산이 시작되는 듯. 특히 누가 물어보면, '이걸 어디에 쓰려는 걸까'부터 생각해보는 게 중요하다는 말.📌 복잡하게 만들수록 좋은 건 아니다"간결함과 정확성을 맞교환하고 있다."→ 복잡하게 만들면 뭔가 더 정확할 것 같지만, 노력 대비 성과가 미미할 수도 있다. 간결함이 더 실용적일 때가 많다.📌 이상한 결과는 귀찮지만 귀중한 단서"계산은 맞는데.. 독서(Reading)/오늘의 책(Today's book) 2025. 6. 3. 실용주의 프로그래머(The Pragmatic Programmer) - 1일차 프로그래밍은 미래를 덜 고통스럽게 만들려 노력하는 것이다.→ 코드는 현재보다 미래를 위한 투자입니다. 유지보수성과 확장성을 염두에 두고 작성하는 습관이 중요합니다.사고방식을 완전히 틀어서 습관, 행동, 기대를 바꾸어야만 한다.→ 진정한 변화는 단순한 방법의 변경이 아닌, 사고 자체를 바꾸는 데서 시작됩니다.무엇보다 중요한 것은 즐기는 것이다.→ 즐겁게 임할 때 창의력과 집중력이 극대화됩니다. 개발도 마찬가지입니다.혹시 책을 읽다가 전에 본 적 없는 단어와 진짜로 마주치게 된다면 부탁하건대 그냥 건너뛰지 말라. 시간을 들여 웹이나 컴퓨터 과학 교과서에서 찾아보라.→ 배움에 대한 태도가 실력을 좌우합니다. 작은 호기심 하나가 깊은 이해로 이어집니다.오직 특정한 환경 조건들마다 가장 적절한 시스템들이 있을 뿐.. 독서(Reading)/오늘의 책(Today's book) 2025. 5. 21. 철학자처럼 질문하라 - 1 들어가는 글빅 파이브Big Five 질문내가 알 수 있는 것은 무엇인가?나는 왜 여기 있는가?나는 누구(어떤 존재)인가?나는 어떻게 행동해야 하는가?나는 앞으로 어떻게 될 것인가? 우리는 2~5 질문에 대해 답하기 전에 우리의 지식으로 간주할 수 있는 것이 무엇인지 그 한계를 분명히 해야 한다.상대편이 자기주장에 적용하는 기준을 이해하고 그 사람의 믿음 이면에 숨겨진 것을 간파하면 상대편의 믿음을 인정해야할지 말아야 할지, 인정하지 못한다면 어떤 식으로 비판해야 할지를 더 잘 이해할 수 있다.자기 믿음에 허점이 드러나는 것을 좋아할 사람은 아무도 없다. 1장 논증, 어떻게 이해할 것인가?논증이라는 말이 나오면 생각의 구조를 떠올려라.논증은 당신이 하고자 하는 주장과 그것을 믿는 이유다. 결론, 전제.가정.. 독서(Reading)/오늘의 책(Today's book) 2025. 2. 9. 당신의 고정관념을 깨뜨릴 심리실험 45가지 - 2 제3장 인지 - 5. 100달러를 날리고 편안한 곳에서 지낼 것인가, 아니면 100달러를 날리고 불편한 곳에서 지낼 것인가인지 부조화(레온 페스팅거, 제임스 칼스미스)사람은 누구나 모순된 존재가 되고 싶어 하지 않는다. 그 불편함은 인지부조화의 결과로 생긴 것이다.우리가 과거의 실수에서 좀처럼 뭔가를 배우지 못하는 이유에 대한 설명으로도 아주 적절하다. 제4장 기억 - 5. 옛 사건에 대한 기억은 지금 이 순간의 질문에 따라 창작될 수도 있다유도심문과 거짓 기억(엘리자베스 로프터스)가장 소름끼치는 생각은 우리가 진심으로 믿고 있는 것이 반드시 진실이지 않을 수도 있다는 점이다. 제5장 동기부여와 감정 - 1. 전기충격과 전기충격 사이에 갇힌 쥐보다 먹이와 전기충격 사이에 갇힌 쥐가 더 괴롭다갈등(닐 밀러.. 독서(Reading)/오늘의 책(Today's book) 2025. 2. 9. 당신의 고정관념을 깨뜨릴 심리실험 45가지 - 1 제2장 학습 - 8. 부모의 행동에 나타나는 예측불가능성이 아이들을 무력하고 우울한 존재로 만든다학습된 무기력(마틴 셀리그만) 통제 불가능한 쇼크에 노출될 때 중요한 것은 쇼크 그 자체가 아니라 쇼크의 통제 불가능성이다일어난 일에 대해 "어쩔 수 없는 것"이라고 믿음해결할 수 있는 문제를 제대로 해결하지 못하고 배울 수 있는 일을 제대로 배우지 못하는 결함이 발생함중요한 문제는 그사람에게 생긴 일이라기보다는 그 사람이 그 일을 해석하는 방식 제2장 학습 - 9. 보상이 주어질 경우, 재미있던 놀이도 일이 될 수 있다보상의 대가(마크 레퍼, 데이비드 그린, 리처드 니스벳)일은 육체가 의무적으로 해야 하는 것인 반면, 놀이는 육체가 굳이 할 의무가 없는 것이다(마크 트웨인)강화가 행동에 미치는 영향만을 고려.. 독서(Reading)/오늘의 책(Today's book) 2025. 2. 8. (Java/자바) 모던 자바 인 액션 chapter 1, 4(2022.10.10) chapter 1. 자바 8, 9, 10, 11 : 무슨 일이 일어나고 있는가? - 메서드 참조 : ::('이 메서드를 값으로 사용하라') - 자바 8부터는 메서드가 이급 값이 아닌 일급 값에 해당한다. - 프레디케이트(predicate) : 인수로 값을 받아 true or false 값을 반환하는 함수 - 익명함수/람다를 통해 일회성 메서드 정의 오버헤드를 줄일 수 있다. - 외부 반복 : for-each 루프를 이용해서 각 요소를 반복하면서 작업을 수행한다. - 내부 반복 : 스트림 API에서 라이브러리 내부에서 모든 데이터가 처리된다. - 컬렉션 : 어떻게 데이터를 저장하고 접근할지에 중점 - 스트림 : 스트림 내의 요소를 쉽게 병렬로 처리할 수 있는 환경을 제공 -> 컬렉션을 필터링할 수 있는 가.. 독서(Reading)/오늘의 책(Today's book) 2022. 10. 10. 클린코드 - 로버트 C.마틴 / 박재호,이해영 옮김 - 코드는 요구사항을 표현하는 언어 - 르블랑의 법칙 / 나중은 결코 오지 않는다 - 나쁜 코드는 개발 속도를 크게 떨어뜨린다. - 나쁜 코드가 쌓일수록 팀 생산성은 떨어진다. - 일정에 쫓기더라도 대다수 관리자는 좋은 코드를 원한다. 그들이 일정과 요구사항을 강력하게 밀어붙이는 이유는 그것이 그들의 책임이기 때문이다. 좋은 코드를 사수하는 일은 바로 우리 프로그래머들의 책임이다. - 나쁜 코드의 위험을 이해하지 못하는 관리자 말을 그대로 따르는 행동은 전문가답지 못하다. - 빨리가는 유일한 방법은, 언제나 코드를 최대한 깨끗하게 유지하는 습관이다. - 깨끗한 코드를 작성하는 프로그래머는 빈 캔퍼스를 우아한 작품으로 바꿔가는 화가와 같다. - 깨끗한 코드는 우아하다(보기에 즐겁다). 깨끗한 코드는 한 가.. 독서(Reading)/오늘의 책(Today's book) 2022. 9. 24. 2022년 7월 2주차 SQL 코딩의 기술(pp.118 ~ 175) BETTER WAY 18. 설계를 변경할 수 없을 때는 뷰로 데이터를 간소화하자 사용자에게 직관적인 데이터를 제공하려면 뷰를 사용한다. 사용자가 정확히 필요한 데이터를 보거나 더는 필요 없는 데이터를 보지 않게 제한하려며 뷰를 사용한다. 필요하면 WITH CHECK OPTION을 사용한다. 복잡한 쿼리를 숨기고 재사용하려면 뷰를 사용한다. 여러 테이블에 있는 데이터를 취합해 보고용 데이터를 만들 때는 뷰를 사용한다. 뷰를 사용하면 코딩 규칙이나 명명법을 강화할 수 있다. 특히 기존 데이터베이스 설계를 변경해서 작업할 때 특히 유용하다. BETTER WAY 19. 비관계형 데이터를 정보성 데이터로 변환할 때는 ETL을 사용하자 BETTER WAY 20. 요약 테이블을 만들어 관리하자. BETTER WAY .. 독서(Reading)/오늘의 책(Today's book) 2022. 7. 14. 2022년 7월 1주차 SQL 코딩의 기술 Chapter 1. 데이터 모델 설계 데이터 모델을 잘못 설계하면 '효율적'인 SQL 작성은 시작도 할 수 없다. BETTER WAY 1.모든 테이블에 기본키가 있는지 확인하자 기본키가 없으면 데이터를 걸러 낼 때 일치하는 로우가 없거나 딱 한 개인 조건은 보장할 수 없다. 기본키가 없는 테이블 간의 관계를 모델링하는 것은 일반적으로 불가능하다. 테이블에 기본키가 없으면 반복적이고 일관성 없는 데이트가 쌓여 쿼리 수행 속도가 느리고, 부정확한 정보를 조회하는 등 모든 종류의 문제를 일으킬 수 있다. 유일한 값을 가져야 한다. NULL 값을 가질 수 없다 값을 갱신할 필요가 없어야 한다. 가능한 한 간단한 형태여야 한다(문자나 부동소수점보다는 정수형, 여러 컬럼보다는 단일 컬럼이 낫다) 참조 무결성을 준수.. 독서(Reading)/오늘의 책(Today's book) 2022. 7. 5. 이전 1 2 3 다음 728x90