중국시가넷 - 한의학 고서 - 파이썬은 어떻게 OCR 인식 모듈을 호출하여 송장을 인식하고 EXCLE 로 출력합니까?
파이썬은 어떻게 OCR 인식 모듈을 호출하여 송장을 인식하고 EXCLE 로 출력합니까?
운영 체제에서 경로 가져오기
Win32com.client 에서 일정을 가져옵니다
운영 체제 가져오기
날짜 시간에서 날짜 시간 가져오기
Def 파일 경로 ():
글로벌 경로 _this_file
Path _ this _ file = path.abspath ('.')+"\ \"
글로벌 경로 _excel
Path_excel = path_this_file+' 정보 내보내기. Xlsx'
글로벌 경로 _ 그림 _ 파일
경로 _ 그림 _ 파일 = 경로 _ 이 파일+'사진'
Def 그림 이름 가져오기 ():
Pic_list = []
Os.listdir(path_pic_file) 에 있는 pic 의 경우:
Pic _ path = path _ pic _ file+'\ \'+pic
Pic_list.append
그림 목록으로 돌아가기
자필 글꼴 (파일 이름) 정의:
로봇 = qqai.vision.ocr.handwritingocr (app _ id, app_key)
Useful _ list =[' 레지스트리']
Value_list = []
Open (파일 이름,' Rb') 을 이미지 파일로 사용:
Result = robot.run (이미지 파일)
Item _ list = result ['data'] ['item _ list']
Item_list 의 값에 대해 다음을 수행합니다.
Words= value['itemstring']
단어가 쓸모없는 목록에 있는 경우:
계속하다
그렇지 않은 경우:
값 _ 목록. 추가 (단어)
반환 값 _ 목록
Def get_useful_list (값 _ 목록):
Key_list = ['이름',' 성별',' 생년월일',' 국가',' 국적',' 직업',' 휴대폰 번호',' 고정 전화번호','
유용한 목록 = []
Value_list 에 있는 단어의 경우:
키워드 목록의 단어인 경우:
Key_index = value_list.index (단어)
Next_index = key_index+1
Ifvalue _ list [next _ index] inkey _ list:
Useful_list.append ('') 입니다
그렇지 않은 경우:
If words ==' 주민등록번호':
Id _ num = ""+str (value _ list [next _ index]) # 이것은 과학적 수 문제를 피하기 위한 것입니다.
유용한 목록. 추가 (ID_NUM)
그렇지 않은 경우:
Useful_list.append (값 목록 [다음 색인])
그렇지 않은 경우:
계속하다
유용한 목록으로 돌아가기
Def put_into_excel (유용한 목록):
Xl = Dispatch("Excel. 적용) 을 참조하십시오
Xl. Visible = False # True 가 표시되고 False 가 숨겨집니다.
Xl. 경고 표시 = 0
Excel _ input = xlworkbooks.open (path _ excel)
워크시트 = excel_input. 워크시트 ('워크시트 1')
Max_row = sheet 입니다. UsedRange.Rows.Count
Values = len (유용한 목록)
범위 내 I (값) 의 경우:
침대 시트. 셀 (max_row+1, I+1). Value = str (유용한 목록 [i])
Excel _ 입력. 저장 ()
Excel _ 입력. 닫기 ()
Xl.quit ()
Starttime = datetime.now ()
""텐센트 AI 오픈 플랫폼 이미지 인식 """
App _ id =' 2110179251'
App_key = '***** *' 입니다
""app_id, app_key 는 텐센트 AI 오픈 플랫폼에 무료로 등록할 수 있습니다. ""
파일 경로 ()
Pic_list = get_pic_name ()
Pic_list 에 있는 파일 이름의 경우:
Value_list =HandwritingOCRImage (파일 이름)
유용한 목록 = 유용한 목록 가져오기 (값 목록)
Excel 에 배치 (유용한 목록)
Endtime = datetime.now ()
Total_time = (종료 시간-시작 시간). 초
인쇄 (">& gt& gt 가 {0} 개의 정보를 성공적으로 입력했으며 {0} 초가 걸렸습니다! "을 클릭합니다. 형식 (길이 (그림 목록), 총 시간)