반응형 전체 글160 태블로 박스 하이라이팅, index활용법(..더 공부 필요함) 박스 하이라이팅하는 방법 숫자를 그래프화하지는 않지만, 숫자의 밀도를 색상으로 보여줌으로 그래프와 같은 역할을 할 수 있게끔 만들어줌. 또는 표현방식을 활용하여 나타낼 수 있다. 고급을 활용하여 가운데를 0으로 사용하면 음수값과 양수 값을 구분하는데 도움이 된다. 분석을 이용해 합계를 나타낼 수 있는 방법 잘 된 예시: ★ Index ★ 줄을 세우는 함수 혹은 줄이 세워진 번호표 나눠주는 함수 코로나 초창기 마스크 배부를 위해 줄을 서서 1, 2, 3 번 지정했던 것과 같음. 월을 기준으로 각각의 연도 별로 줄을 세움. 각각의 분기 별로 줄을 세움. 열선반 빈칸을 클릭해서 index()를 만들어주자. 기획/데이터 리터러시 2022. 1. 7. 태블로 박스 플롯, 히스토그램 이해하기 (테이블계산...) 박스 플롯 줄 수 있는 정보가 히스토그램보다 조금 더 많다. 총 학생수가 151명이고, 상위 75명, 하위 75명, 중앙을 1명으로 계산 한 값을 보여준다. 중앙값이 78.12이므로 분포는 78.12 이상이 75명이 차지하고 있고, 이하가 75명이 차지하고 있다. 그 값의 또 중앙 값을 찾는다. 따라서 1/4 + 1/4 + 1/4 + 1/4의 합계를 나타낸 그래프이다. 초록색 이음새(?) 부분 외 값을 아웃라이어라 처리한다. (통계학적으로 비정상 값이라 부른다. 너무 높거나, 너무 낮은값. 비정상적으로 잘하는 애들, 비정상적으로 못하는 애들....ㅎ) 무슨 근거로 아웃라이어 처리라고 할까? 통계학적으로 IQR 기법을 이용하여 IQR *1.5 가 되는 숫자를 빼고 더한 값을 Q1, Q2, Q3라 명한다. .. 기획/데이터 리터러시 2022. 1. 7. 태블로 기초 설정 방법 및 기초 개념들 1. 화면 기본 설정(아무것도 안보이게 만들기) 서식 - 격자선, 열 기준선, 축눈금자 만 생략 가능하다. 그 외 삭제 불가능 2. 세로 축 눈금 없애는 방법 3. 서식 잡는 방법 3-1. (전체 적용) - 해당 필드를 다이렉트로 조정 (좌측 패널 설정) 3-2. 상단 패널에서 설정 행 열 선반에서 서식을 변경할 때, 축을 건드리면 그래프가 변경된다. 패널만 변경할 것. 4. 생략했던 상단 제목 살리기 팁. 처음 서식을 잘 정해놓으면 나머지를 끌고 갈 수 있다. 어떻게? 우클릭 - 복제 메뉴 선택 필요한 부분만 갈아끼우면 된다. 예) 처음부터 가구, 사무용품, 전자제품의 색상을 지정해놔야 다음 시트에서도 동일하게 사용이 가능하다. 5. 태블로 기본 설정 : sum 을 everage 등으로 변경하기 6. .. 기획/데이터 리터러시 2022. 1. 7. [피그마] 전체/페이지만/프레임 위치 공유하기 기능 1. 전체 공유하기 1-1. 초대하기 링크를 공유하기 원하는 상대의 이메일을 입력하고 invite 버튼을 클릭하면, 상대에게 이메일이 전송되고 파일이 공유된다. 1-2. copy link 링크를 복사해서 원하는 상대에게 공유한다 2. 페이지만 공유하기 하나의 프로젝트 내 하나의 페이지만 공유하고 싶다면, 페이지 우클릭 페이지공유를 시도하면 된다. 3. 프레임 위치 공유하기 프레임만 공유될 수 있는 기능은 없다. 프레임이 워낙 많이 생성되다 보니, 프레임 위치는 공유할 수 있다. 1. 공유하기 원하는 프레임을 선택 2. share 버튼 클릭 3. link to selected frame 체크하기 4. copy link 클릭 과정을 거치면 선택된 프레임 위치가 공유되고, 링크를 클릭해 접속하게 되면 프레임 .. 디자인/UIUX 2022. 1. 3. 파이썬의 자료형, 변수 정수형 int : 소수점이 없는 수 예:1,2,3,4,67 실수형 float : 소수점이 있는 수 예:1.0, 21.4 문자열형 str: 하나 또는 다수의 문자로 구성된 형, 쌍따옴표나 홀따옴표를 사용한다. 예: python 부울형 bool 예: True, False 리스트 list 예: [1.2.3] 튜플 tuple 예: {1,2,3} 딕셔너리 dict 예: {'지구과학':90, '수학':94} 집합 set 예: {'빨강','파랑'} 변수(Varialbe) - 변수란 데이터가 저장되는 메모리 공간을 의미한다. - 이름(name), 자료형(type), 값(value), 메모리주소(id)를 가진다. - 변수의 이름(name)으로 변수에 접근한다. 변수 이름 작성 규칙 - 영문, 숫자, _ 만으로 구성된다... 개발/파이썬 2021. 12. 30. 파이썬 문법 기초 구분자는 기본적으로 한칸의 공백이다. 이 구분자를 변경하고 싶다면 sep를 사용해야한다. 예1. ,(콤마)를 구분자로 사용하고 싶다면 sep=','라는 명령을 내리면 된다. 예2. 공백 없는 구분자를 사용하고 싶다면 sep=''라는 명령어를 내리면 된다. 개발/파이썬 2021. 12. 29. 아나콘다 설치 후 주피터 노트북 여는 방법, nbextension 설치 방법 1. 아나콘다 설치 후 주피터 노트북 여는 방법 아나콘다 홈페이지에서 파일 설치 이후 아나콘다 프롬프트를 실행 설치한 경로를 통해 주피터 노트북을 열어야 한다. 나는 C드라이브에 pythondata 폴더를 생성하여 설치했으므로 경로는 다음과 같다 cd c:\pythondata 경로가 pythondata로 변경된 것을 확인하고 jupyter notebook 을 입력한다. 웹사이트(주피터 노트북)가 띄워진다. 참고로 프롬프트를 계속해서 열어놔야 주피터 컴퓨터가 활성화 된다. 닫지 않기로 약속! 2. 확장 프로그램 nbextension 설치하기 먼저 주피터 노트북을 완전히 닫아주고 프롬프트를 재시작한다. 그 다음에 아래의 명령어를 입력하고 엔터 pip install jupyter_contrib_nbextens.. 기획/데이터 리터러시 2021. 12. 28. 데이터분석 기초 데이터 수집 방법 1. 기업의 데이터베이스 : 일반인 접근 불가능 2. 공공데이터, 민간데이터(유료/무료) : 제공되는 데이터 3. 웹스크래핑: 웹에서 수집 4. 설문, 센서데이터: 직접 수집 공공데이터 제공 활용은 해마다 늘고 있다. CSV, XLSX, JSON, XML, 오픈API의 형태로 제공된다. CSV 형태로 제공되는 형태가 가장 손쉽다. 데이터 전처리 필요한 속성만 추출 : 불필요한 컬럼 제거 결축치 식별/처리: 대표값(중간값, 최빈값, 평균값)으로 대치 / 주변값: 이전값, 다음값 / 대표값이 할 수 없는 경우가 생긴다면, 결축치가 있는 행 삭제 혹은 결축치가 많은 열(속성)삭제 1,2,3,100의 평균은 50에 가까우나 결축치를 50으로 작성하기에 무리가 있음. 자료형 변경 : 숫자로 처리.. 기획/데이터 리터러시 2021. 12. 28. 기술통계 개념 모집단→ 표집(sampling)/수(N) → 표본 뮤, 시그마← 추론통계 ← X-bar, S 모집단에서 표본을 가지고 데이터 분석을 해야한다. *뮤: 모평균 *시그마: 모편균의 표준편차 *X-bar: 표본의 평균 *S: 표본의 표준편차 표본의 현상을 보는 것을 기술 통계라고 함. 일어나지 않은 데이터를 찾아내는 것은 모집단의 데이터를 추론하는 것이므로 추론통계라한다. 기술통계란? 수집한 데이터를 요약, 묘사, 설명하는 통계기법 표본 자체의 속성을 파악하는데 주안점을 두는 데이터 분석방법 주로 표본에 속한 대상자들의 인구통계학적 속성과 함께 연구문제나 가설에 포함된 개별적인 변인에 대한 표본 대상자의 응답, 즉 데이터 속성을 특정한 통계량을 사용해 요약해준다. 추론 통계 전 사전 작업으로도 많이 사용된다... 기획/데이터 리터러시 2021. 12. 27. 소셜빅데이터 결과 보고서 작성법 - 4 서론: 다이어트 도시락 트렌드 리서치 결과 본론: 다이어트 도시락 관련 니즈 - 연관어, 긍부정어 결론: 부서별 제안 사항 - 컨셉 구체화 1. 다이어트 도시락 트렌드 리서치 - 유로모니터에 따르면 2020년 밀키트 시장규모는 전년 대비 85% 증가한 1882억원으로 2025년까지 연평균 31% 수준 성장해 7253억원에 이를 것으로 전망된다. - 간편식은 주로 대형마트를 통해 유통되나 그 비중이 점점 줄어드는 추세며 편의점 유통은 증가세를 보이고 있다. - 코로나 팬데믹 이후 새벽배송, 당일배송 서비스가 급격히 확대됨에 따라 온라인 유통 비중도 꾸준하게 증가하고 있다. - 외식이 줄어들면서 맛집 음식에 대한 수요와 외식 업계의 온라인 진출 전략이 맞물려 밀키트로 개발한 콜라보 제품이 크게 주목받고 있다.. 기획 2021. 12. 27. 데이터 기반 문제정의를 위한 연관어 분석/가설 수립/인과관계 분석(크리도시락) -3 년도별 검색추이로 연관어 변화를 확인하고 트렌드를 확인 할 수 있다. 다이어트 도시락이 압도적으로 1위를 유지하고 있고, 21년도에는 양많은 도시락, 도시락정기배송과 같은 기존의 도시락 검색 키워드와는 다른 형태의 키워드가 나타나고 있다. 썸트랜드로 도시락과 관련된 키워드를 확인해볼 수 있다. 그렇다면 인과관계가 있는지 데이터로 확인해보자. 무료제공되는 네이버데이터랩을 이용했다. 인과관계를 도출하기 위해 엑셀 회귀분석을 돌려 볼 수 있다. y축(종속변수=연관어) x축(독립변수=밀키트) 설정했을때의 인과관계를 확인해보자. y축은 x축에 연관받는다. 기획 2021. 12. 27. 데이터 기반 문제정의를 위한 가설 수립과 검증 / 업계트랜드, 경쟁사 분석(크리스마스, 편의점 도시락) -2 거시량을 분석하는 것도 중요하지만, 데이터 교차 검증용 다른 분석툴을 활용하는 것 또한 필요하다. 하지만 크리스마스는 계절이라는 특수성이 있었기에 어느 툴이나 유사하게 나왔다. 예를들어, 편의점 도시락 검색시 네이버와 카카오는 유사한 그래프를 그렸지만, 구글은 유사한 데이터를 그리지 않았다. 아무래도 편의점도시락을 검색하는 이유는 리뷰를 보기 위해 검색을 할텐데, 가설1. 리뷰가 잘 서칭되는 네이버와 다음에서 많이 검색을 했을 것이라는 가설을 세웠다. 그러한 가설을 입증하기 위해 구글에 편의점 도시락 연관검색어라던가, 편의점도시락을 검색했을때 추천순위를 노출한다거나 판매처를 보여주는 결과가 '잘'보였다. 근데 생각해보면 내가 만약 편의점도시락의 내용이나 가격이 궁금해서 인터넷 서칭이 필요하다면, 만만한 .. 기획 2021. 12. 26. 이전 1 ··· 3 4 5 6 7 8 9 ··· 14 다음 💲 추천 글 반응형