티스토리

나무늘보의 블로그
검색하기

블로그 홈

나무늘보의 블로그

continuous-development.tistory.com/m

혼자 끄적끄적하는 블로그 입니다.

구독자
8
방명록 방문하기
공지 글 보실 때 주의사항 모두보기

주요 글 목록

  • [Python] 파이썬으로 간단한 STT(음성인식) 개발해보기 STT란? 음성인식(Speech-to-Text, STT)은, 사람이 발화한 음성을 컴퓨터가 이해할 수 있는 텍스트로 변환하는 기술을 말합니다. STT은 최근에 자연어 처리 기술의 발전과 함께 빠르게 발전해 왔으며, 스마트폰의 음성인식 기능, 가상비서, 음성 검색 등 다양한 분야에서 활용되고 있습니다. STT 시스템은 다음과 같은 구성 요소로 이루어져 있습니다. 음성 입력: 사용자가 발화한 음성을 입력받는 부분입니다. 마이크나 전화기와 같은 장비를 통해 입력받을 수 있습니다. 전처리: 입력된 음성 신호를 디지털 신호로 변환하고, 필터링, 잡음 제거 등의 전처리 작업을 수행합니다. 특징 추출: 전처리된 음성 신호에서 특징을 추출합니다. 일반적으로는 Mel-frequency cepstral coefficien.. 공감수 0 댓글수 0 2023. 3. 22.
  • [Python] 간단한 코드로 TTS(음성인식) 개발해보기 1.TTS란? 텍스트 음성합성(Text-to-Speech, TTS)은, 입력된 텍스트를 음성으로 변환하는 기술을 말합니다. TTS는 컴퓨터, 스마트폰, 차량 내비게이션 등 다양한 분야에서 사용되며, 특히 최근에는 인공지능 기술의 발전과 함께 음성 합성의 정교화 및 자연스러운 발화를 위한 기술의 발전으로 큰 관심을 받고 있습니다. TTS 시스템은 다음과 같은 구성 요소로 이루어져 있습니다. 텍스트 입력: 사용자가 입력한 텍스트를 입력받는 부분입니다. 일반적으로는 텍스트 파일 또는 사용자의 직접 입력을 받아들일 수 있습니다. 언어 모델링: 입력된 텍스트를 자연어 처리 기술을 이용하여 분석하고, 문장 구성 및 단어 선택 등의 작업을 수행합니다. 음성 모델링: 언어 모델링을 기반으로 음성 모델을 만듭니다. 음성.. 공감수 0 댓글수 0 2023. 3. 22.
  • [Book & Youtube - 11번째 공부] 나이에 전혀 상관없이 가장 빨리 성공하는 비밀 나이에 전혀 상관없이 가장 빨리 성공하는 비밀 오늘의 영상은 아래와 같다. 유튜브롤 보다가 알고리즘을 타고 들어간 영상이였다. https://youtube.com/watch?v=nPI9ORI1gUA&feature=share 내용을 정리하자면 아래와 같다. 1.설득과 영향력에 대한 책을 읽거나 소셜미디어 / 유튜브 영상으로 배워야 한다. 그들을 멘토삼아 나를 발전해야 한다. => 나보다 조금이라도 더 나은점이 있거나 배울점이 있는 사람을 기준으로 잡고 그 사람처럼 되기 위해 노력한다. 실존하거나 글이 명확히 있거나 이러한 것들을 통해 좀 더 구체화 할 수 있다. 2.빠르게 목표 설정하기 당장 종이에 목표를 적고 행동하며 결과를 적어 놓는다. => 행동과 그것에 대한 기록을 통해 내가 노력을 하고 있는지에 .. 공감수 0 댓글수 0 2022. 11. 3.
  • [Book & Youtube] 프로덕트오너 - 1장 프로덕트 오너는 미니 CEO다 1장 - 프로덕트 오너는 미니 CEO다 1)PO는 중심에 있다 po는 특정서비스에 대한 책임을 지는자다. 다양한 기업들의 개발 방향성이 PO를 통해 정해진다. PO는 실질적으로 고객이 무엇을 필요로 하는지 끊임없이 분석하고, 선보이려는 서비스가 사업 목표와 부합하는지 검증한다. 그리고 개발자나 디자이너 같은 메이커와 새로운 기능을 만들거나 기존 서비스를 개선한다 그래서 PO는 늘 수많은 사람들과 만나고, 질문에 대답하고 결정을 내려줘야 한다. PO는 사실을 기반으로 모두를 위한 최선의 우선순위와 결정을 내려야 할 책임을 가진 중심적인 역할을 하는 사람이다. 프로덕트 매니저는 시장 조사를 하고, 프로토 타입을 만들고, 실험하고, 디자인 또는 개발 자원과 협업하고, 최종 제품을 고객에게 선보여야 한다. # .. 공감수 0 댓글수 0 2022. 11. 2.
  • [Book & Youtube] 스타트업 서바이벌 1화를 본 후기 스타트업 서바이벌 1 화를 본 후기 이번에 본가에 내려갔다가 티비를 돌리다 우연히 발견 했다. 이전에 이런 비슷한 포맷의 방송이 있던걸로 기억하는데 이번에도 새롭게 하나보다. 방송을 본 후기다. 1.IR은 유튜브로 많이 찾아보고 준비해야 한다. IR에 대해서 기본적으로 준비가 많이 안된 참여자가 있었는데 아쉬웠다. 아무리 상품이 좋아도 그걸 제대로 설명하지 못한다면 상품이 보이지 않지 않겠는가 ㅜ 2.IR 발표에 대해 발표때 시간은 어느정도의 여유시간을 갖아야 하며 시간에 대해서 강박을 가질 정도로 꼭 맞춰서 발표해야 한다.. 시간에 따른 발표 자료와 발표 양을 정해놔야 할 것 같다. 기본 100초 / 3분 / 10분 이정도는 준비해야 하는 것 같다. 그리고 반드시 반드시 시간을 잘 지켜야 한다. 그리고.. 공감수 4 댓글수 0 2022. 10. 15.
  • [Book & Youtube] 역행자 - 8. 역행자7단계_역행자의 쳇바퀴 역행자 7단계_역행자의 쳇바퀴 인간이 불행해지는 이유는 간단하다. 원인1. 성장하는 방법을 모른다. 제자리걸음에 결정적 역할을 하는 것은 자의식, 유전자의 오작동, 지능, 방법론의 부재다. 정확한 단계를 이해하고 반복적으로 성장 해야 한다. 원인2. 자원에 대한 압박을 받는다. 풍족한 자원에 대한 욕구가 충족되지 않는다면 뇌는 결국 자신이 원했던 도파민을 얻지 못함에 따라 인간에게 채찍질을 한다. 우울감 이라는 처벌을 내린다. 원인3. 성장이 멈춰 열등감이 반복적으로 쌓인다. 정체성이 잘 잡혀있는 사람은 누군가 잘나가더라도 나도 결국 성장할거야라는 자신감을 가져야 한다. 부모가 어땠는지, 유전자가 어떘는지, 국가가 어땠는지 따질필요 없다. 현재 상황을 직면하고, 이제 뭘 하면 될지를 고민하자. 역행자 7.. 공감수 0 댓글수 0 2022. 8. 31.
  • [Book & Youtube] 역행자 - 7. 역행자6단계_경제적 자유를 얻는 구체적 루트 역행자6단계_경제적 자유를 얻는 구체적 루트 1.돈을버는 근본원리 상대를 편하게 해주기 상대를 행복하게 해주기 이 두가지가 사업과 투자의 시작이자 끝이다. 돈을 버는 핵심은 '문제 해결력'에 있다. 사람들이 어떤 것에 불편함을 느끼는지, 어떤 것에 행복을 느끼는지 알아내야 한다. 어떻게 불편함을 해결해 행복감을 줄수 있는 아이디어를 내고, 실제로 해결책을 마련하면 된다. 어떤 경우든 '남의 문제를 해결해주는 것', 이게 사업의 본질이고 수익의 원천이다. -생각정리 제일 간단하면서도 본질에 가까운 것 같다. 내가 하고 싶고 내가 만들고 싶은게 아닌 누군가가 필요하고 무언가를 채워줬으면 하는 것을 채우는 것이 모든 것들의 기본인 것 같다. 2.경제적 자유라는 성을 함락시키는 방법 경제적 자유라는 성 10만명.. 공감수 0 댓글수 2 2022. 8. 31.
  • [Book & Youtube] 역행자 - 6. 역행자5단계_역행자의 지식 역행자5단계 - 역행자의 지식 1.기버이론_ 역행자는 1을 받으면 2를 준다 역행자라면 단기 손실을 감수하고서라고 장기적인 투자를 해야한다. 기버(퍼주는 사람)가 되긴 하되 테이커를 구분하자. 기버 - 퍼주는 사람 테이커 - 받기만 하는 사람 매체 - 준 만큼 되돌려주는 사람 -책에서 던지는 질문 지난1년간 자신이 어떤 기버행동을 했는지 기억해보아라. 책을 덮고 10분간 산책을 나가서 생각에 잠기는 것도 좋다. => 간단한 선물을 주는 것과 내가 알고 있는 지식을 전달하는 것을 많이 한 것 같다. 최근에 본인 인생에 가장 큰 영향을 준 사람에게 카카오톡 선물하기를 통해 선물을 보내거나 돈을 송금하라. 혹은 상대가 어려워 보이는 점이 있다면 나름대로 해결책을 적어서 보내주어라 => 자청님한테 보내야하나.... 공감수 0 댓글수 2 2022. 8. 17.
  • [Book & Youtube] 역행자 - 5. 역행자4단계_뇌 자동화 역행자4단계 - 뇌 자동화 뇌 최적화 1단계_22전략 작가는 여기서 뇌 최적화를 하는 것으로서 22전략을 말한다. 22전략이란 2년만 매일 2시간씩 책을 읽고 글을 쓰는 것을 말한다. 이 행위를 통해서 다작,다독,다상량(많이 생각하기)를 이룬다. 이러한 일련의 행위는 의사 결정력을 높이고 뇌의 지식을 활성시키는데 있다. 뇌의 활성화는 몸의 코어근육과 같은 역할을 한다고 한다. 몸의 코어근육처럼 뇌의 코어를 단련을 통해 내가 하는 미래의 무수한 결정과 선택에 있어서 최선의 선택을 하게끔 이끌어 주는 역할을 해준다고 한다. 뇌 최적화 2단계_오목 이론 눈앞의 이득과 소득에 집착하지 않고 장기적으로 두는 수를 오목이론이라고 한다. 작가는 이곳에서 현재의 작은 가치보다는 미래에 얻을 큰 것을 위해 현재를 미래에.. 공감수 0 댓글수 0 2022. 8. 12.
  • [Book & Youtube] 역행자 - 4. 역행자3단계_유전자 오작동 극복 역행자 3단계 - 유전자 오작동 극복 나방들은 왜 가로등 유리안에 들어가서 죽음을 맞이할까 실제로 불을 향해가는것이 아니라 빛을향해 일정한 각도로 나는 특성 떄문에, 나선을 그리면서 점점 불을 향해 날아가게 될 뿐이라고 한다. 수만 년 전 초원에서 나방의 생존에 도움이 됐을 본능이 오늘날에는 나방의 생존을 어렵게 한다고 한다 . 이런 일이 인간에게도 벌어지는데 이걸 작가는 '클루지 바이러스라'고 부른다. 이러한 클루지 바이러스는 객관적으로 봤을때 하지 않아야 할 행동들을 본능에 이끌려 실수를 만든다고 한다. '클루지' 라는 책이 있는데 그 저자인 개리 마커스는 진화라는게 아주 합리적이거나 계획적으로 일어난 게 아니라는 점을 지적한다. 사람이 무언가를 하려고 할 때 결심만하고 실행을 못하는 이유로서 인간은.. 공감수 0 댓글수 0 2022. 8. 11.
  • [Book & Youtube] 역행자 - 3. 역행자2단계_정체성 만들기 역행자 2단계 - 정체성 만들기 자의식 해체를 이루었다면, 새로운 자의식을 세워야 할 차례다. 정체성은 삶의 동기라고 표현한고 있다. 자기 자신 스스로 내가 바라는 어떤것이 되겠다는 목표를 가지는 것과 함께 그 사람이 될 거라는 최면을 거는 것이다. 그것과 함께 그 모습을 얻기 위해 인식의 초점을 그곳에 두고 생활하고 사는 것 같다. 보통 이런 정체성의 변화는 어떤 계기로 많이 생긴다고 한다. 예를들어 좌절, 열등감,. 생존위기,동기부여, 책등 다양한 계기로 발생한다고 나와있다. 어렸을때 책을 보면서 그런 생각을 한 적이 있었다. 남들이 말하는 정말 그런 큰 사건이 내게 오면 내가 쫌 더 변하지 않았을까 더 이악물고 무언가를 하지 않았을 까라는 어린 생각을 했었다. 보통은 그런 드라마틱한 무언가를 통해 .. 공감수 0 댓글수 0 2022. 8. 9.
  • [Book & Youtube] 역행자 - 2. 역행자1단계_자의식 해체 이번에 보기시작한 책은 역행자 라는 책이다. 이전에 글에 썻듯이 유튜브를 보다가 책의 저자분이 나와서 말씀하시는 걸 보고 구매하게 되었다. 챕터 1이 서론 부분이라 건너띄고 2부터 하려고 한다. 챕터 2에서는 자의식의 해체와 관련 된 내용이 있다. 책에서는 대부분의 사람들이 인생에서 완전한 자유를 얻지 못하는 이유중 근본적인 원인을 과잉 자의식이라고 본다. 대다수는 자의식을 보호하기 위해 정보를 쳐낸다고 한다. 자의식을 해체하지 않는 이상은 어떠한 정보도 받을 수 없다고 한다. 이러한 과잉 자의식은 사람을 보호하는데 사용한다고 한다. 팩트를 팩트로 받아들이지 않고 내가 상처입지 않고 피해받지 않는 방식으로 정보를 왜곡하고 변형하여 받아들이게 한다고 한다. 예를들어 A라는 사람이 있을때 이 사람이 내가보기.. 공감수 0 댓글수 0 2022. 8. 8.
  • [Book & Youtube] 딱 2가지만 지켜도 자수성가 쉽게 할 수 있어요. - 드로우 앤드류 오늘 본 youtube 영상 2가지로서 드로우앤드류 - "딱 2가지만 지켜도 자수성가 쉽게 할 수 있어요." / "(경제적 자유에 가까워지는) 독서 & 글쓰기 딱 이렇게만 하세요"이다. 역행자라는 책을 낸 사람이 게스트로 나왔다. 좋았던 부분이 몇 가지가 있어 블로그에 남기려고 한다. 첫 번째 영상 자수성가한 사람이 한 세 가지 다작 / 다독 다상량(많이 생각하는 것)이라고 한다. 이것을 가지면 인생에 패배할 수 없다고 한다. 하루 2시간씩 2년간 글쓰기, 책 읽기를 하면 인생에서 패배할 수 없다고 한다. 두 번째 영상 1. 책에서 마음에 드는 구절에 표시 2. 텍스트로 옮겨서 내 생각 적기 이걸 보면서 책마다 다르긴 하겠지만 책의 가장 큰 장점은 책을 통해 얻을 수 있는 지식과 내가 살지 못하는 삶과 .. 공감수 0 댓글수 0 2022. 8. 1.
  • [Book] 그로스 해킹 - 데이터와 실험을 통해 성장하는 서비스 만드는 방법 (1,2 장 정리) 1.그로스 해킹이란 1.1 그로스 해킹 그거, 우리도 해봅시다. - 성장 할 수 있는 방법을 해킹 하는 것 서비스 출시는 끝이 아닌 시작에 가깝다. 출시 후 서비스에 대한 사용자의 평가를 듣고, 사용 패턴을 분석하고, 새로운 기능을 추가함으로써 서비스를 꾸준히 개선할 수 있다면 성공 확률은 높아진다. 즉 그로스 해킹은 어떻게 하면 성장하는 서비스를 만들 수 있을까? 그로스 해킹은 이 질문의 답을 찾는 과정이라고 할 수 있다. 그로스 해킹은 각 서비스의 사용 맥락이나 시장 상황을 반영해서 진행할 때만 의미가 있다. 1.2 그로스 해킹의 지름길이 있을까? 데이터에서 찾아낸 인사이트를 바탕으로 제품이나 서비스를 지속적으로 개선해 나가는 방법을 익혀야 한다. 1.3 그로스 해킹 이해하기 크로스펑셔널 팀(Cros.. 공감수 0 댓글수 0 2021. 11. 22.
  • [Graph DB]그래프 데이터 베이스(Graph Database)란? (정의, 장점, 사례) 그래프 데이터 베이스란? 정의 그래프 데이터 베이스는 그래프 이론에 토대를 둔 일종은 NoSQL 로서 관계를 저장하고 탐색하도록 구축되어있는 데이터 베이스다. 즉 데이터 간의 관계에 초점을 둔 데이터 베이스다. 점차 데이터가 불규칙해지고 관계가 복잡해짐에 따라 기존에 사용하던 관계형 DB로는 관계를 표현하기에 한계점에 도달했고 또한 한다해도 많은 관계를 잇는대 있어서 엄청난 시간과 컴퓨팅 파워가 필요해졌다. 그러한 문제를 해결 해 줄 수 있는 것이 그래프 DB이다. 그래프 DB는 노드(node = Vertex)를 사용하여 데이터 엔터티를 저장하고 엣지로는 엔터티 간의 관계를 저장합니다. 엣지는 항상 시작 노드, 끝 노드, 유형과 방향을 가지며, 상-하위 관계, 동작, 소유자 등을 문서화 합니다. 하나의 .. 공감수 2 댓글수 0 2021. 7. 7.
  • [Graph DB]Amazon Neptune 란 무엇인가? Amazon Neptune 란 무엇인가? Amazon Neptune 은 빠르고 안정적인 종합 관리형 그래프 데이터베이스 서비스로, 고도로 연결된 데이터 세트를 사용하는 애플리케이션을 쉽게 빌드 및 실행할 수 있다. Neptune 의 핵심은 특별한 용도의 고성능 그래프 데이터베이스 엔진이다. 즉 그래프 데이터 베이스를 사용하는데 있어서 다양한 도움을 준다. 지원하는 언어 Apache TinkerPop Gremlin W3C의 SPARQL 사용 사례 추천 엔진 -그래프 데이터베이스에서 고객 관심, 친구, 구매 이력 같은 정보 범주 사이의 관계를 저장한 다음 해당 데이터를 쿼리하여 맞춤화되고 관련성이 높은 추천 사기 탐지 - 신용 카드 구매 및 구매 위치를 추적하여 특이한 사용을 감지하거나 구매자가 알려진 사기.. 공감수 0 댓글수 0 2021. 7. 6.
  • [Data analysis] 고급 google 애널리틱스 - 5.고급 마케팅 도구 (정리) 리마케팅 소개 웹사이트 또는 앱을 방문했던 사용자에게 광고 콘텐츠를 다시 보여줄 수 있는 기능 사용자가 내 사이트를 방문했다가 구매를 하지 않은 경우 리마케팅을 이용해 Google 디스플레이, 모바일 앱, Google 검색에서 이 사용자에게 관련 광고를 게재하면서 웹사이트 재방문과 구매를 유도 필요조건 애널리틱스 속성 설정에서 광고 기능을 사용 설정 Google Ads 또는 Display & Video 360 계정을 애널리틱스에 연결 동적 리마케팅을 활용한 타겟팅 정확도 개선 사용자가 이전에 내 사이트에서 조회했던 콘텐츠 또는 제품이나 실적이 우수한 관련 콘텐츠 및 제품, 구매 내역 및 인구통계에 기반해 타겟팅 Google Ads 계정과 애널리틱스 계정을 연결하고, 이전에 설명한 것처럼 광고 기능을 사용.. 공감수 0 댓글수 0 2021. 7. 5.
  • [Dacon] 행동 데이터 분석 인공지능 AI 경진대회 2등 코드 분석 행동 데이터 분석 인공지능 AI 경진대회 주제 대회는 Blizzard 스타크래프트2 경기의 행동 데이터로 승패를 예측 배경 게임을 잘하는 나라’, ‘E-sports의 성지’라는 호칭을 얻게 된 요인에 게이머들의 탁월한 전략이 함께 합니다. 그리고 여러분은 데이터를 분석하여 전략을 발전시킬 수 있는 능력을 갖추고 있습니다. E-Sports 속 한국이란 나라의 위용에 걸맞은 알고리즘을 만들어주세요! 여러분이 만든 알고리즘이 우리의 게임 실력을 한층 더 발전시킬 수 있습니다. 평가 - AUC 소스 [2등][도발하려던건 아니었습니다만]Ensembled CatBoost Model 1.Library & Data # 라이브러리 설치 import os # 디렉토리 설정 os.chdir("/data") import wa.. 공감수 0 댓글수 0 2021. 7. 4.
  • [Data analysis] 고급 google 애널리틱스 - 4.고급 마케팅 도구 (정리) 리마케팅 소개 웹사이트 또는 앱을 방문했던 사용자에게 광고 콘텐츠를 다시 보여줄 수 있는 기능 사용자가 내 사이트를 방문했다가 구매를 하지 않은 경우 리마케팅을 이용해 Google 디스플레이, 모바일 앱, Google 검색에서 이 사용자에게 관련 광고를 게재하면서 웹사이트 재방문과 구매를 유도 필요조건 애널리틱스 속성 설정에서 광고 기능을 사용 설정 Google Ads 또는 Display & Video 360 계정을 애널리틱스에 연결 동적 리마케팅을 활용한 타겟팅 정확도 개선 사용자가 이전에 내 사이트에서 조회했던 콘텐츠 또는 제품이나 실적이 우수한 관련 콘텐츠 및 제품, 구매 내역 및 인구통계에 기반해 타겟팅 Google Ads 계정과 애널리틱스 계정을 연결하고, 이전에 설명한 것처럼 광고 기능을 사용.. 공감수 0 댓글수 0 2021. 7. 3.
  • [Data analysis] 고급 google 애널리틱스 - 3.고급 분석 도구 및 기법 (정리) 통계를 위한 세그먼트 데이터 Google 애널리틱스의 세분화는 보고서에서 하위 집합의 데이터를 조회하는 방식 세그먼트 종류 사용자 세그먼트 - 최대 90일의 여러 세션이 포함(특정 연령, 기간, 성별 등등) 세션 세그먼트 - 단일 세션에서 발생하는 사용자 행동으로 한정 (하나의 세션에서 도달한 목표나 발생시킨 수익) 장점 여러 세그먼트를 보고서 하나에 추가하여 비교 가능 ex) 구매 사용자 vs 비구매 사용자 / 사용자 세그먼트와 세션 세그먼트는 측정기준, 측정항목, 세션 날짜를 이용해 만들 수 있으며, 사용자 액션의 순서를 이용해서도 만들수 있음 세그먼트 유형 기본 - 기본 시스셈 섹션에 존재 / 한번에 최대 4개 맞춤 - 내가 원하는 기준의 세그먼트 생성 채널별 데이터 분석 기여모델 - 마케팅 캠페인.. 공감수 0 댓글수 0 2021. 7. 2.
  • [Data analysis] 고급 google 애널리틱스 - 2.데이터 수집 및 구성 설정 (정리) 데이터 수집 및 구성 설정 1.애널리틱스 계정 구성 계정 계정 생성시 계정에 고유한 ID 가 할당 이 ID는 애널리틱스 추적 코드에 표시 추적 코드에서 올바른 애널리틱스 계정으로 조회 데이터를 전송하는 데 이를 활용 속성 비즈니스 조직을 더욱 정확히 반영할 수 있도록 애널리틱스 게정별로 여러 개의 속성 만듬 ex) 웹사이트와 모바일을 다른 속성 관리 가능 교차 도메인 - 동일한 세션에서 발생하는 관련 웹사이트 간 이동을 인식하는 기능(사이트 연결) 모든 사이트의 각 페이지에서 애널리틱스 추적 코드를 수정 필요 360 고객의 경우에는 롤업 보고 기능을 이용하면 여러 속성의 데이터가 하나의 새로운 통합 속성에서 자동 집계 됨 사용자 권한 계정에 따른 속성수 제한 각 속성에도 보기수 제한 2.보기에서 고급 필.. 공감수 0 댓글수 0 2021. 7. 1.
  • [Data analysis] 고급 google 애널리틱스 - 1.데이터 수집 및 처리 (정리) 1.데이터 수집 및 처리 차례 1.Google 애널리틱스 데이터 수집 2.사용자 및 세션 분류하기 3.구성 설정 적용하기 4.데이터 저장하기 및 보고서 만들기 5.츨정 계획 수립하기 1.google 애널리틱스 데이터 수집 데이터를 수집하기 위해 자스크립트 추적 코드로 부터 시작 웹사이트에서 사용자 상호작용이 발생할때 마다 애널리틱스 추적 코드가 조회를 통해 google 애널리틱스로 전송 된다. 이 안에 다양한 정보가 들어간다. ex) 언어, 사용중인 페이지 이름, 화면 해상도 등등 조회의 3가지 유형 페이지 뷰 - 추적코드가 삽입된 웹페이지가 로드될 때 실행 이벤트 - 웹사이트의 특정 요소와 상호작용하는 매 순간을 추적(이벤트 액션, 카테고리, 라벨 , 값 등의 데이터 매개변수가 전송) 거래 - 구매한 .. 공감수 0 댓글수 0 2021. 6. 30.
  • [Data analysis] google Analytics - 데이터 수집 및 처리 데이터 수집 및 처리 google 애널리틱스 데이터 수집 데이터를 수집하기 위해 자스크립트 추적 코드로 부터 시작 웹사이트에서 사용자 상호작용이 발생할때 마다 애널리틱스 추적 코드가 조회를 통해 google 애널리틱스로 전송 된다. 이 안에 다양한 정보가 들어간다. ex) 언어, 사용중인 페이지 이름, 화면 해상도 등등 조회의 3가지 유형 페이지 뷰 - 추적코드가 삽입된 웹페이지가 로드될 때 실행 이벤트 - 웹사이트의 특정 요소와 상호작용하는 매 순간을 추적(이벤트 액션, 카테고리, 라벨 , 값 등의 데이터 매개변수가 전송) 거래 - 구매한 제품, 거래 ID 재고보관 단위 와 같은 전자상거래 구매 관련 데이터 전송 사용자 및 세션으로 데이터 분류하기 신규 사용자와 재사용자 구분 사용자 방문시 사용자의 브.. 공감수 0 댓글수 0 2021. 6. 29.
  • [Dacon] 심리 성향 예측 AI 경진대회 - Auto ML 하는 방법 심리 성향 예측 AI 경진대회 이 대회는 Dacon에서 진행한 대회로서 심리학 테스트 분석 알고리즘 개발 하는 대회였다. (https://dacon.io/competitions/official/235647/overview/description) 이 대회에서 어떤 착한분이 간단하게 AutoML를 하는 소스에 대해서 공유를 해줬는데 AutoML를 경험해보는데 있어서 좋은 경험이 될 것 같아서 가져왔다. 데이터 평가 심사 기준: AUC 소스 경로 설정 (Define your path) path = 'data/' import os os.listdir(path) 데이터 불러오기 (Read Data) import pandas as pd train = pd.read_csv(path + 'train.csv') test.. 공감수 0 댓글수 2 2021. 6. 21.
  • [Dacon] 신용카드 사용자 연체 예측 AI 경진대회 1위 코드 분석 신용카드 사용자 연체 예측 AI 경진대회 주제 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발하는 대회였다. 배경 신용카드사는 신용카드 신청자가 제출한 개인정보와 데이터를 활용해 신용 점수를 산정한다. 신용카드사는 이 신용 점수를 활용해 신청자의 향후 채무 불이행과 신용카드 대급 연체 가능성을 예측한다, 평가 - Logloss 소스 [Private 1위 0.6581] | 소회의실 | Catboost 이 소스에서는 여러가지 모델을 사용했지만 catboost가 성능이 가장 잘나왔다고 했다. catboost 같은 경우에는 범주형 변수 처리에 더 효과적인 모델링이라고 한다. 이 사람이 생각한 핵심 포인트는 아래와 같다. family_size > 7 제거 (이상치 제거) 중복데이터.. 공감수 0 댓글수 0 2021. 6. 17.
  • [Dacon] 2020 D CUP Google Analytics 데이터 1위 코드 분석 2020 D CUP Google Analytics 데이터 이 대회는 Dacon에서 진행한 대회로서 과거의 데이콘 데이터를 활용한 미래의 사용자 행동 패턴을 예측 하는 대회였다. 데이터 자체는 ga 기반의 데이터이여서 깔끔했다. 데이터 데이터 형태는 이런 식이였고 안에 데이터 형태는 이와 같았다. 평가 심사 기준: Weighted RMSE 사용자 수, 세션 수, 신규 방문자 수, 페이지 뷰 수 4가지 항목을 예측하는 대회입니다. 각 변수의 크기가 다르기 때문에 가중치를 부여한 RMSE로 모델의 성능을 평가합니다. 소스 Private 1위, Private 점수 1.60023점, Linear Regression (소스는 1위했던 분의 소스 였습니다.) import os os.chdir('/content/dri.. 공감수 0 댓글수 0 2021. 6. 16.
  • [ML/DL] 베이지안 최적화(Bayesizan Optimization)란? 베이지안 최적화란? "Bayesian Optimization의 핵심은 사전 정보를 최적 값 탐색에 반영하는 것이다!" 여기서 제일 중요한것 두 가지가 나온다. 첫 번째는 사전 정보이고 두 번째는 최적 값 탐색이다. 이제 이말을 좀 더 풀어써보겠다. 베이지안 최적화에서는 Surrogate model과 Acquisition function이 두가지를 통해 결과를 내고 다시 학습하는 것처럼 계속 돌아간다. (내 생각에는 부스팅 학습 같은 방식 같다.) Surrogate model이란 것은 지금까지의 데이터를 통해 내가 예상하는 값의 모델링이 이렇다 라고 만들게 된다. 수학적으로는 목적함수에 대해 확률적으로 추정한 결과라고 하는 것 같다. 이제 이렇게 만들어진 모델을 기반으로 다음 탐색 지점을 결정하게 된다. .. 공감수 0 댓글수 0 2021. 6. 9.
  • [Data analysis] google 애널리틱스 소개_1(디지털 애널리틱스가 중요한 이유) 디지털 애널리틱스가 중요한 이유 디지널 애널리틱스란? 일반적으로 사용자들은 상품을 단계적으로 구매한다. 마케팅에서는 구매 유입경로의 개념을 활용하고 있으며 고객의 상호작용에 대해 설명하는 유입경로에는 여러가지 단계가 있다. 기본구매 유입경로엔,ㄴ 획득 단계 인지도 제고와 사용자 관심분야 확보 시점이고 행동단계는 사용자가 귀사에 참여하는 시점이며 전환 단계는 사용자가 귀사의 고객이 되어 거래하는 시점이다. 온라인에서는 이러한 과정을 측정하기 어려울수 있지만 디지털 애널리틱스를 통해 유입경로의 다양한 측면을 측정할 수 있다. 구매를 유도한 온라인 동작이 무엇인지 추적하고 해당 데이터를 이용하여 신규 및 기존 고객에게 도달하는 정확한 방법을 판단할 수 있다. ex 매장의 목표가 티셔츠 판매량을 올리는 것 이라.. 공감수 0 댓글수 0 2021. 5. 27.
  • [Data analysis] 그럼에도 데이터 분석은 불완전하다 (데이터 분석의 힘 chapter.7) 그럼에도 데이터 분석은 불완전하다 : 불량 분석을 피하기 위한 방법 데이터 자체에 문제가 있다면 모든게 무용지물 데이터 자체에 문제가 있으면 아무리 뛰어난 분석 기법을 써도 신뢰성 있는 결과를 내기 어렵다. 다음과 같은 경우 데이터에 문제가 있는것이다.. 데이터 측정에 문제가 있고 수치도 바르게 기재되어 있지않다 관측치에 대량의 결측치가 있다. 데이터를 모든 세대가 아닌, 편중된 표본에서만 확보했다. 분석 결과의 외적 타당성이라는 문제 RCT나 자연실험으로 발견한 인과관계가 분석 표본 이외의 다른 대상에게도 적용되는지에 대해서는 신중한 논의가 필요하다. 내적 타당성이 확보되었다고 해도 다른 실험 결과를 다른 세대에도 적용할 수 있는냐는 다른 문제이다. 분석방법 외적 타당성의 범위 : 개입효과를 분석할 수.. 공감수 0 댓글수 0 2021. 5. 25.
  • [Salese Force] Salese Force 의 Lightnig Platform 사용 방법_3(소스 올리고 받기) 공감수 0 댓글수 0 2021. 5. 24.
    문의안내
    • 티스토리
    • 로그인
    • 고객센터

    티스토리는 카카오에서 사랑을 담아 만듭니다.

    © Kakao Corp.