본문 바로가기

문자

(2)
(AMI / Python) 이미지 내 문자 추출 도구 Tesseract-ocr 사용하기(기초편) 이번 글에서는 Amazon Linux(AMI) 및 Python에서 Tesseract-ocr을 설치하고 사용하는 법을 알아본다. 먼저 Tesseract-ocr 이란 무엇인가부터 보자.간단하게, 이미지에서 문자를 추출하기 위한 ocr 기술을 오픈소스로 제공하는 도구로 보면 된다. 사실 이것과 관련해서는 이 블로그 외에도 다른 블로그에도 상당히 많은 자료가 있어서 금방 찾기가 쉽다.하지만, Amazon Linux AMI 및 Python 2.7 기반에서 설치 및 사용하는 부분은 문서 하나로 정리되어 있지 않고 여러 문서를 통해서 나타나 있어서이를 하나로 정리하고자 포스팅을 올려본다. 개발 환경OS: Amazon Linux AMIpython: 2.7tesseract-ocr: 3.04 1. tesseract-ocr..
정치권 문자폭탄과 마케팅 서두는 표창원 국회의원이 올린 SNS의 입장으로.. 사실 이 글을 쓰기 전에 고민을 좀 해봤습니다.정치(Politics) 카테고리에 넣을까, 아니면 마케팅(Marketing) 카테고리에 넣을까. 마케팅 쪽으로 넣는 것이 더욱 적합하다고 판단을 하였고, 발행 주제 역시 '경영,직장' 쪽으로 하였습니다. 정치권 문자폭탄하고 마케팅이 무슨 관계가 있냐고요?관계가 당연히 있죠. 아주 많이 있습니다. 그것이 도대체 무슨 연관관계가 있는지를 들어보기 위한 것이 지금 쓰고자 하는 글의 목적입니다. 사실 국회의원의 전화번호를 알아내고, 그 전화번호에다가 수많은 문자를 보내서 괴롭히게 하는 것이 올바른 행동은 당연히 아닙니다. 그래서 그 자체를 옹호를 할 생각은 당연히 없습니다.그러나, 어디까지가 문자폭탄이고, 어디까지..