크몽

[크몽] 문서내 특정키워드 추출, 교차하는 프로그램

알 수 없는 사용자 2019. 9. 3. 17:33
분야: IT·프로그래밍/프로그램 개발
등록일: 0001-01-01
지원자: 0명
지원마감: 2019-09-30까지
예상기간: ~2019.10.31
예상비용: 1,000,000원
준비상태: 개발환경 보유
필요기술:  
미팅방식: 세금계산서 불필요
희망지역:  

프로젝트 내용

1. localhost에 논문을 hwp, pdf, doc 등으로 업로드하여 참고문헌을 제외한 나머지(본문) 참고문헌으로 자동 분류 해야 함.

2. 분류된 문서에서 특정 키워드를 추출하게 되어 있음. 특정 키워드란 논문내 인용을 말하며 소스, 로직을 확인하면 알수 있음. 추출되어서는 안되는 예외 키워드가 현재 약 100여개 있는데 이부분이 소스로는 너무 복잡하니까 예외키워드를 DB화해서 정리해야 함. 앞으로도 예외 키워드는 계속해서 나올 예정 임.

3. 추출키워드(논문내 인용)와 업로드문서 내의 참고문헌과 상호 비교하고 교차, 비교차로 현재 로직이 구분되어 있음. 교차하지 않고 본문에만 있는 인용에 있어서는 버튼을 추가해서 구글 스칼라에서 검색을 하고 검색결과 일치하면 일치하는 정보도 역시 교차된 데이터로 이동하는 로직을 추가해야 함.

4. 교차된 키워드는 구글 스칼라, riss에서 API하여 참고문헌이 존재여부 확인하고 검증하고 있음. 하지만 예외에 따른 오류가 있어서 이부분 수정해야 함.

5. 검증 키워드는 국제양식 APA양식에 맞게 양식변경하게 되어 있음. 하지만 예외에 따른 오류가 있어서 이부분 수정해야 함.

6. 최종 결과를 적합성(매칭률, 검증률)을 보여주고 적합성 결과를 hwp, pdf, doc로 다운로드하는 로직을 추가해야함. 다운로드 결과의 내용은 각각의 색과 특성(볼트, 이텔릭체)을 가지고 있어야 함.




특별한 버전이나 기능상의 문제가 없다면 지금의 소스에서 업데이트 소스만 덮어씌워서 업데이트 하는것을 원합니다.
제 위치는 관악구, 동작구 인근이며 1회이상 미팅을 희망합니다.



첨부파일:
현재 사용중인 소스, 업데이트 전후ui, 업데이트 세부설명, 업데이트 간단설명