聰明不如鈍筆
총명불여둔필

방명록

account_circle
vpn_key
web

security

mode_edit
  • 댓글 수정/삭제 익명
    2022.03.22 16:11

    비밀댓글입니다

  • 댓글 수정/삭제 알린이
    2022.03.15 15:07

    기자님 글을 보고 난 후, 바로 책(친절한 R with 스포츠 데이터)을 사서 열공중인 직딩입니다.

    책을 읽어가던 중 오타로 추정(?)되는 것을 발견하여 신고(?)하려고 글 남깁니다.
    99페이지 상단에, 출루율을 구하는 공식이 있는데, 분모에 "안타"가 있더라구요.
    "안타"가 아닌, "타수"가 맞는 것 아닌지 여쭤봅니다.

    아래에,
    obp = (h + bb + hbp) / (ab + bb + hbp + sf) 라고 코딩은 되어 있어요.

    나중에 추가로 책을 인쇄하실 계획이 있는 경우 고려 바랍니다.
    호옥시 제가 잘못 알고 있다면, 방념해주세요.

    열공해서 얼른 알린이에서 벗어나도록 하겠습니다.

    감사합니다.

  • 댓글 수정/삭제 익명
    2022.02.09 11:08

    비밀댓글입니다

    • 수정/삭제 kini
      2022.02.13 14:56 신고

      랜덤 포레스트 포스팅에 대해 말씀하시는 거라면 기존 데이터가 맞습니다. bind_cols() 함수는 이름 그대로 일대일로 열을 붙여주는 구실을 합니다.

  • 댓글 수정/삭제 인사쟁이
    2022.02.08 10:57

    안녕하세요, 선생님

    저는 회사 인사팀에서 근무하고 있는 직원입니다.
    최근에 조직진단을 실시해서 결과를 받았는데 응답률이 조직별로 다르지만 40~50%에 불과합니다.

    막연한 느낌에 2,500명에 40% 응답이라면 그 값을 대표값으로 써도되겠지만
    10명, 20명, 40~50명 등 인원수가 작은 조직의 경우에도 대표값으로 써도될지 걱정이 되어
    이것 저것 찾아보다가 모집단 크기와 샘플 수를 활용하여 오차범위를 구하는 공식을 알게 되었습니다.

    공식 : e = Z * sqrt{ (p*(1-p)*(N-n) / n(N-1) }
    N=모집단 크기, n=샘플수 , Z=1.96 , P=0.5

    해당 공식에 모집단의 수(해당 조직 총인원)과 표본수(설문에 응답한 인원)을 넣어
    조직별 오차범위를 구하는 것 까지는 했는데
    이 오차범위로 신뢰구간을 구하는 방식을 모르겠습니다.

    예를 들어
    공식에 따르면 모집단 100명 조직에 80명이 응답한 경우 오차범위는 4.9%입니다.
    해당 조직의 만족도 평균 점수는 3.2(5점 척도)인데
    3.2를 100점만점으로 환산하면
    (점수-1)*25으로 계산하여 55점입니다.

    55점에 대해 오차범위 4.9%를 표시한다면
    55점*(1-4.9%) ~55점*(1+4.9%) = 52.305 ~ 57.697 인지
    55점-100점*4.9% ~ 55점+100점*4.9% = 50.1 ~ 59.99 인지 궁금합니다.

    아무리 찾아도 선거 여론조사에서 오차범위 3.1%면
    앞뒤로 3.1%씩 빼고 더해서 신뢰구간을 구하는 예시만 있고
    지지율과 같은 %값이 아닌 경우는 어떻게 계산하는지에 대한 설명을 찾지못해
    이렇게 질문드립니다.

    도움 부탁드립니다.

  • 댓글 수정/삭제 익명
    2022.01.19 10:53

    비밀댓글입니다

  • 댓글 수정/삭제 익명
    2021.12.14 09:50

    비밀댓글입니다

    • 수정/삭제 kini
      2021.12.25 12:38 신고

      패키지를 직접 만드실 정도면 오히려 제가 배워야 할 것 같은데요?

  • 댓글 수정/삭제 SK
    2021.03.02 14:04

    안녕하세요 ! R 네트워크 연결망 관련하여 질문있어서 방명록에 글 남깁니다 ㅎ
    질문하고자 하는 내용을 가수-피쳐링 데이터 기준으로 설명드리면
    csv 파일 내 From열, to열 이렇게 2개의 열이 있는데
    예를들어 여기에 2차 연관어로 3번째 열(to_2)을 추가하려면 코드를 어찌 구성해야 할까요? 해당 페이지에 올라온 코드로는 From, to 2개 열만 인식되는 것 같아서요

  • 댓글 수정/삭제 익명
    2021.02.26 12:12

    비밀댓글입니다

    • 수정/삭제 kini
      2021.03.16 15:38 신고

      to1을 from에 붙여서 to2와 연결하면 되지 않을까요? 가중치 역시 해당 부분에 적용하시면 문제가 없을 듯합니다.

  • 댓글 수정/삭제 임정규
    2021.02.18 12:43

    안녕하세요 키니님, 평소에 블로그를 통해 많이 배우고 있습니다. 제가 R로 만든 인터렉티브 지도를 HTML을 통해 제가 만든 웹사이트에 게시하고 싶은데, 어떻게 하셨는지 그리고 어떻게 코드를 짜야되는지 여쭙고 싶습니다

    • 수정/삭제 kini
      2021.02.22 11:23 신고

      leaflet 작업 결과 자체가 HTML 문서라서 코드를 그냥 붙여넣기만 하시면 되는데 질문이 무슨 뜻인지 잘 이해가 가지 않네요.

  • 댓글 수정/삭제 익명
    2021.01.11 11:30

    비밀댓글입니다

    • 수정/삭제 kini
      2021.02.22 11:21 신고

      예를 들어 19만7000건 ± 2만 건이 예상 범위였다면 21만 건은 그 정도에 들어 있으니까 오차범위 안에 있다고 할 수 있습니다.