• 목록
  • 아래로
  • 위로

아시다시피 카카오 REST API 중에 문자영역감지 기능이 있습니다.


https://developers.kakao.com/docs/restapi/vision#%EB%AC%B8%EC%9E%90-%EC%98%81%EC%97%AD-%EA%B0%90%EC%A7%80


간단히 설명드리면 이미지를 POST로 전송하면 문자영역을 감지하여 좌표값을 반환합니다.


즉 문자영역감지 API는 좌표값만 반환하고, 이를 다시 OCR API에 넣어줘야 인식한 문자열을 반환합니다.



카카오 문자영역감지 API를 테스트하기 위해 Wavve에서 고독한 미식가 영상의 한 장면을 캡쳐했습니다 ^^





다음과 같은 스크립트를 작성하여 카카오 API를 이용하여 문자영역을 감지하고, Pillow를 이용하여 감지한 영역을 빨간색 사각형으로 표시했습니다.


processing 함수는 제가 주먹구구식으로 대충 만든 것이라서 허접합니다 ㅠㅠ


import requests, json
from PIL import Image, ImageDraw

MYAPP_KEY = 'API 키를 입력하세요'

def detect_area(filename):
    API_URL = 'https://kapi.kakao.com/v1/vision/text/detect'
    headers = {'Authorization': 'KakaoAK {}'.format(MYAPP_KEY)}
    try:
        files = { 'file' : open(filename, 'rb')}
        resp = requests.post(url=API_URL, headers=headers, files=files)
        resp.raise_for_status()
        result = resp.json()['result']['boxes']
        return result
    except Exception as e:
        print(str(e))

def processing(file, box_list):
    im = Image.open(file)
    draw = ImageDraw.Draw(im)
    for box in box_list:
        for a in range(0, 4):
            if a <= 2:
                b = a + 1
            else:
                b = 0
            draw.line(box[a] + box[b], fill=128, width=5)
    return im

file = '파일명'
box_list = detect_area(file)
im = processing(file, box_list)
filename = ''.join(file.split('.')[:-1]) + '_detect.' + file.split('.')[-1]
im.save(filename)




완벽하지는 않지만 어느 정도 성공적이라고 볼 수 있을까요? ^-^


녹색 간판의 상단이 인식되지 않은 것을 보면, Tesseract의 일부 버전에서는 원형으로 나열된 문자열도 인식하는 옵션이 있었던 것 같은데 카카오 API는 아직 이 부분이 약한 것 같네요.





수 백개의 이미지로 테스트해봤는데요.


인식이 의외로 잘 되는 경우도 있고, 그렇지 않은 경우도 있습니다.


제가 우연히 발견한 한 가지 재미있는 점은 문자영역감지 API에서 인식이 되지 않은 이미지라도, 좌표값을 잘 넣어서 OCR API에 보내면 문자를 인식하는 경우가 적지 않더군요 ㄷㄷ

작성자
이니스프리 119 Lv. (2%) 4189480/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

공유

facebooktwitterpinterestbandkakao story
퍼머링크

댓글 0

권한이 없습니다.
  • 갤럭시 노트8을 구매(?)하였습니다.갤럭시 노트8을 구매(?)하였습니다.
    예. 그렇습니다. 노트8입니다. 64GB 메이플 골드 색상 모델이예요. 저걸 벗기면 상자가 하나 나옵니다. 이걸 열면 핸드폰이 나옵니다. 여러분의 눈건강을 위하여 일부를 삭제하였습니다. 크네요. 일단 써 봐야 겠어요...
  • 일찍 들어온 G402일찍 들어온 G402
    그렇습니다. 아마존 오늘의 딜로 19달러 99센트에 주문해서 미국에서 한국까지 날아오는 데 12달러 넘게 든 바로 그 G402입니다. 원래 5월 이후에나 온다고나 했던 마우스인데, 기적적으로 배송 기간이 짧아져 현지시...
    • NoYeah
    • 조회 수 286
    • 20.05.04.02:43
    studyforus.com 사이트 평가
  • 포켓몬스터 금을 질렀습니다.포켓몬스터 금을 질렀습니다.
    이 글은 제르의 블로그에서도 보실 수 있습니다. 만약 당신이 이 글을 해당 블로그나 Study For Us 리뷰/자랑하기 게시판이 아닌 곳에서 보고 계신다면, 그 글은 불펌된 것이니 빨리 제르에게 알리고 치킨을 뜯는 게 ...
  • https://www.photopea.com/ Photopea | Online Photo Editor Photopea Online Photo Editor lets you edit photos, apply effects, filters, add text, crop or resize p... photopea.com 포토샵이 없으신분들, 무료...
  • 맥북과 쫄개들 - m1 mac air 고급형과 k380, 마이크로소프트 디자이너 마우스를 중심으로맥북과 쫄개들 - m1 mac air 고급형과 k380, 마이크로소프트 디자이너 마우스를 중심으로
    맥을 받은지도 근 한달이 조금 안되었는데, 그동안 느낀 점 위주로 써보겠습니당. 1. Macbook Air (M1, 8cpu/8gpu, 512GB ssd, 8GB ram) 한마디로 요약하자면 "혁명" 이라고 할 수 있겠습니다. 학생할인으로 150만원...
  • 테슬라 모델3 렌트 후기 (내돈내후)테슬라 모델3 렌트 후기 (내돈내후)
    1. 序 테슬라 구매 전에 테스트 목적으로 렌트를 하려고 알아보던 중에 운좋게 이번 연휴 기간에 서울 SK 렌터카 지점 중 단 한 군데에 예약이 가능한 차량이 있어서 렌트를 하게 되었습니다 ^^ 렌트 차량은 모델3 스...
  • 앱코 AWK20앱코 AWK20
    • 터두
    • 조회 수 166
    • 22.04.30.18:13
    쿠팡에서 3만원 정도로 산 키보드입니다 https://www.coupang.com/vp/products/6146464332?itemId=11832389560&vendorItemId=79105816115&q=AWK20&itemsCount=35&searchId=427b3393225040acb833f4bdc37c0c8b&rank=1&i...
  • [리뷰] H.Point -> 네이버페이 포인트 전환[리뷰] H.Point -> 네이버페이 포인트 전환
    https://studyforus.com/deals/966030 [생활정보] H.Point -> 네이버페이 포인트 전환 방법 예전에 현대백화점을 주로 이용하다가 최근 신세계백화점을 주로 이용하다보니 상당히 많은 포인트가 유효기간이 도래하였...
  • 무선 랜 카드를 구매하였습니다.무선 랜 카드를 구매하였습니다.
    나중에 서버로 라떼판다를 한 대 들여놓을 예정이었는데, 그렇게 되면 공유기 포트가 꽉 차서 PC 한 대만 유선으로 연결할 수 있게 되는 겁니다. 물론 예전에도 다이소산 5000원짜리 무선 와이파이 수신기가 있었지만...
  • UAG를 추천해주시는 분들이 많아서 결국 UAG로 질렀네요 ^^ 러기드는 사실상 국내에서 품절인 것 같아서 플라이오로 선택했어요~! 모나크는 안전성은 최고라고 하지만 너무 투박해 보여서요 ㄷㄷ 간단히 리뷰를 해보...
  • [폰케이스 교체] 슈피겐 리퀴드 크리스탈[폰케이스 교체] 슈피겐 리퀴드 크리스탈
    말씀드렸던 것과 같이 힐링쉴드에서 UAG 케이스를 더 이상 사용하지 않도록 조언을 받아서 부득이 교체했네요 ㅠㅠ 이 제품은 사이드가 TPU 소재여서 아래 글에서 말씀드린 간섭 문제는 다행히도 없더군요~! 이용에 ...
  • 안랩 오진 신고 및 회신안랩 오진 신고 및 회신
    빠른 처리 감사드립니다! 알약의 경우에는 예전에 길호넷에서 직접 오진 신고를 한 것으로 알고 있네요 :)
  • [Python] MoviePy를 이용한 MP4 -> GIF 변환 및 resize 테스트[Python] MoviePy를 이용한 MP4 -> GIF 변환 및 resize 테스트
    MoviePy를 이용하여 MP4 -> GIF 변환을 하고 resize 하여 파일 크기를 비교하는 테스트를 진행해봤습니다. 테스트 파일의 출처는 아래 유튜브 채널입니다. (원 출처는 영상에 표기되어 있습니다.) https://www.youtub...
  • [리뷰] Campsaver 직구 후기 및 약간의 팁(?)[리뷰] Campsaver 직구 후기 및 약간의 팁(?)
    요새 Campsaver에서 한창 FW 상품을 세일하고 있는데, 간략한 직구 후기 및 팁에 관해 글을 남깁니다 ^^ Campsaver에 새 계정을 생성한 후 첫 번째 주문에 대하여 결제를 하면 신용카드 유효성 검증을 거쳐야 합니다!...
  • [리뷰] 테슬라 차량 인도 팁[리뷰] 테슬라 차량 인도 팁
    아래 내용은 2021년 6월을 기준으로 작성되었습니다 ^^ 1. 위치 인도 장소는 테슬라 발산 딜리버리 센터입니다. 얼마 전 수원에서 이전한 것으로 알고 있습니다. 위치는 이대 서울병원 부속주차장 지하 5층에 소재하...
  • [ChatGPT] 교보문고 출석체크의 퀴즈를 풀어보기[ChatGPT] 교보문고 출석체크의 퀴즈를 풀어보기
    교보문고 홈페이지에서는 매일 출석체크를 하고 퀴즈를 풀면 쿠폰을 제공합니다 ^-^ 출석체크를 하면 도장 1개 + 퀴즈를 풀면 추가 도장 1개 이런 방식입니다. 물론 제가 인문학적 지식이 부족한 탓이겠지만, 가끔은 ...
  • 기존에 올린 리뷰에 아래와 같은 내용을 추가합니다. 1. 장점 (1) 지난 8개월 간 비교적 꾸준히 사용한 결과 음질, 휴대성, 안정성 등 측면에서 전반적으로 만족스러운 편입니다. 물론 포터블이 아닌 DAC에 별도의 앰...
  • 아멕스 리저브 및 메리어트 본보이 더 베스트 카드 발급 후기아멕스 리저브 및 메리어트 본보이 더 베스트 카드 발급 후기
    이 글에서는 신용카드 발급 과정 및 전반적인 혜택에 대해 대략적으로 리뷰합니다. 구체적인 혜택이나 메리트에 대해서는 스샤샤나 카드고릴라 등 사이트를 참조하시면 도움이 되실 것 같습니다 ^^ 1. 아멕스 리저브 ...
  • iPadOS 17 개발자 베타 리뷰iPadOS 17 개발자 베타 리뷰
    • kpj
    • 조회 수 169
    • 23.06.11.20:19
    WWDC 2023이 끝나고 바로 개발자 베타를 설치해 사용 중입니다. 일단 블투 설정에서 MAC주소만 뜨는 버그가 있었는데, 해당 문제는 피드백 넣으니 해결되더라구요 그리고 잠금화면 커스텀에서 멈춰버리는 일도 있었는...