목록Case Study (30)
IT is Smart
발음하기 어려운 이름은 토론하기도 어렵다. 프로그래밍은 사회 활동이다. 흔히 시간가 관련된 변수 명으로 genymdhms(generate date, year, month, day, hour, minute, second)와 같이 이름 짓는 경우가 종종 있다. 어떻게 발음해야 할지도 모르겠지만 설명하기도 쉽지 않다.generateTimestamp라고 이름 짓는 것이 훨씬 의미도 명확하고 변수명으로 설명하기도 좋다. ※ 로버트 C 마틴의 클린 코드 참고
컴파일러나 인터프리터만 통과하려는 생각에 스스로 문제를 일으키는 경우가 있다.예를 들어, 동일한 범위 안에서는 다른 두 개념에 같은 이름을 사용하지 못한다. 그래서 한쪽 이름을 마음대로 변경하려는 유혹에 빠지곤 한다. 철자를 살짝 바꿨다가 나중에 스펠링 오류를 고치는 순간 컴파일이 안되는 상황을 겪게 된다.컴파일러를 통과하더라도 연속된 숫자를 붙이거나 의미없는 문자를 추가하는 방식은 적절하지 못하다. 이름이 달라야 한다면 의미도 달라져야 한다.a1, a2와 같은 방식이 흔히 사용하는 방식이지만 아무런 의미가 없어 코드를 바로 이해하기 어렵게 만든다.또, Product라는 클래스가 있는데 다른 클래스를 ProductInfo 혹은 ProductData라고 이름 지으면 개념을 구분할 수 없이 그저 이름만 다르..
의도와 다른 의미의 정보를 코드에 남겨두면 안된다. 여러 계정을 그룹으로 묶을 때 실제 List가 아니면 accountList로 이름을 지으면 안된다. List는 프로그램에서 특정한 의미를 갖기 때문이다. 그러므로 accountGroup이나 단순히 Accounts라고 이름짓는게 좋다. 서로 비슷한 이름을 사용하는 것도 주의해야 한다.XYZControllerForEfficientHandlingOfStrings라는 이름을 사용하면서 XYZControllerForEfficientStorageOfStrings라는 이름을 같이 사용한다면 어떨까? 두 이름은 매우 비슷하다. 이름으로 그릇된 정보를 제공하는 진짜 끔찍한 예가 소문자 L이나 대문자 O변수이다. 두 변수를 한꺼번에 사용하면 더욱 끔찍해진다. 소문자 L은..
텍스트마이닝 절차 간략정리 3단계 ① 텍스트 수집 : 외부 소셜미디어, 인터넷카페, 언론매체, 블로그, 게시판 댓글, 포탈 등 ② 텍스트 분석 : 분석엔진을 사용 Concept 키워드사전, Categorizer 총량 긍정/부정, Duplication Check,Text Miner 연관어 도출 ③ 결과의 활용 : Dashboard, Insight Report, Social Consulting 등 텍스트마이닝 절차 정리 4단계 ① 데이터 수집 : Crawling ↓ ② 어휘 추출 : 형태소분석, TF/DF 문서분해 ↓ ③ 정보 추출 : 필요정보 추출 ↓ ④ 정보 분석 : 빈도, 분류, 클러스터링(그룹핑), 컨셉링크(관계연결) 등 분석프로세스① 텍스트 수집, 가공과 정제 과정 문법, 철자 등 오류가 포함된 원..
정보처리기술을 데이터 수집 기술, 데이터 구조화 저장 기술, 데이터 분석 기술로 나누어 볼 때 처리 대상이 ‘빅데이터’인 경우 그 빅데이터의 형태에 따라 데이터 수집하고 저장하는 기술이 새롭게 필요합니다. 구조화된 이후의 데이터는 기존의 분석 기술을 적용하면 되는 것입니다. 빅데이터와 관련된 IT분야는 빅데이터를 관리하고 분석할 수 있도록 도와주는 플랫폼을 다루는 영역과 빅데이터를 처리하고 분석하는 영역으로 크게 나뉩니다. 빅데이터 플랫폼은 크게 다음 2가지로 나눌 수 있습니다. 하나는 오픈소스인 아파치 하둡을 중심으로 빅데이터를 분산하여 저장하고 병렬로 처리 할 수 있는 일련의 기능 플랫폼들이 생태계의 구성요소처럼 상호작용하도록 구성된 하둡 에코 시스템이고, 다른 하나는 기존 상업적인 벤더들이 자사의 ..
어려운 점 ① 해당언어에 대한 깊이있는 이해, 문화나 습관에 대한 이해가 필요하다. ② 문장과 문장 사이에 숨어 있는 정보를 이해하기 어렵다. 정보재료가 후보자 이름으로 검색한 결과를 모은 것일때 A 후보자와 관련된 내용이 90%이고 B 후보자에 대한 내용이 10%로 언급되었다면 그 기사는 누구의 기사일까? ③ 긍정적 견해와 부정적 견해의 정의는 무엇인가? - 직접 분석 진행하는 것과 결과를 이해하는 것은 차원이 다른 일이다. - 과정의 어려움을 잘 모른다. 결과에 대한 적절한 보상이 어렵다. 극복방안 ① 타겟 도메인(대상)을 좁혀서 관심을 집중할 수 있게 한다. ② Context Analysis, Sentimental Analysis 기법 사용을 통한 보완