2008년 12월 29일 월요일

[연구노트]공기록의 접근성 향상

잠시 미뤄두었던...
government information access
government information disclosure
government information dissemination
등으로 불리던 정보공개, 사전공표 관련 자료를 다시 뒤지고 있다.

1. Koga, Takashi. "Access to Government Information in Japan: A Long Way toward Electronic Government?" Government Information Quarterly. Vol. 20, No. 1, Feb. 2003, p. 47-62.

- 일본의 현황(2003년)을 진단하고, 문제점을 지적하고, 대안을 제시
- 현황: 인식이나 시스템이 초기단계이지만, 법률 개정과 전자정부 관련 사업의 추진 등으로 비교적 많이 개선된 상황임
- 연구목적: 일본 공기록의 제공과 접근 분석
- 연구방법: 관련 법령과 사업을 검토하고 문제점을 분석한 다음 정보 접근성 향상을 위한 대안 제시
- 연구범위: 입법, 사업, 지자체를 제외한 중앙행정기관만을 대상으로 함

현재 구상과 관련된 이 논의 이슈
1) 사전공표의 개념인 'proactive provision'이 일본의 정보공개법(IDL)에서 강조되고 있다는 것이 나온다(특징으로 제시했으며, 40조에 나오고 4가지 카테고리도 있다.)
2) 기록관리의 뒷받침도 강조하고 있는데, 37조에 나온다.
논문의 내용뿐 아니라 게재지나 저자의 국적도 참고할 만하다.
다른 연구나 다른 나라의 현황에 대한 리뷰는 찾아보기 어렵다.



* 참고: 저자 홈페이지 있음

2008년 12월 22일 월요일

[학술지]Journal of Archival Organization

* 저널 정보 *
journal of archival organization
ISSN:1533-2748
Pub Date: 1/1/2002
Authors Ruth C. Carter
Thomas J. Frusciano

Publisher Haworth Press, Inc. Binghamton, NY, USA
DOI Bookmark: 10.1300/J201v01n01_01

*목 차*

* 저널 샘플 *

2008년 11월 23일 일요일

2008년 11월 1일 토요일

[도서]An Introduction to FRBR by Arlene G. Taylor(In Understanding FRBR )(cont'd)

10/12에 이어서

An Introduction to FRBR
by Arlene G. Taylor(In Understanding FRBR pp.1-19)
In Understanding FRBR Edited by Arlene G. Taylor.

check point

4. pp.9~10
FRBR의 attribute가 FRBRoo의 property로 된 사례
: attribute - value ==> property - instance로
FRBR는 "title of work"(attribute)-"show boat"
FRBRoo는 the work(-"show boat") "created by" person(-"Edna Ferber")
와 같이 FRBRoo는 모두 "관계"로 처리함

5. p.14
FRBR - Text oriented
따라서 non text에 적용학기 위해서는 다른분야의 목록규칙을 함께 볼 필요가 있음


6. pp.23-24
FRAD에서의 person, family, corporate body 중 family는 archival community를 포괄하려는 것임.

* 추가자료 *
1) Museum information system(pdf)
2) 동영상 저작 개발에도 FRBRoo고려(공연저작과 녹음저작)

7. pp.36-(chapet 4)에서는 "work"의 개념에 대해 다루고 있음

1) pp.41-42
저작, 개념 등에 대한 목록작성자의 고민을 표현했음. 그러나 인쇄자료가 중심이며, 유물이나 공연 정보자원에 대해서는 인쇄자료 수준의 고민이 수행되지 않았음

2) pp.48-49
work - intellectual part
book - material part
FRBR에서는 출판 과정에서의 지적 작업에 대한 고려가 부족했음
FRBRoo에서는 이 점을 보완

3) p.62
FRBR에 관한 후속연구 중 세 번째에서 FRBR/CRM 관련 언급이 있음

4) p.65
FRBR 응용에 관한 연구중 semantic web 관련 언급이 있음. 이것이 FRBRoo와 관련 가능(나)

8. p.83
FRBR에서의 "저작"
'instantiation' -> 저작에 시간개념 도입
museum, archive와 연계
instantiation network와 bibliographic family와의 유사성

9. p.97
도서관 소장물과 기록관 소장물과의 관계

10. p.98
FRBR의 핵심개체: work
기록물의 핵심개체: collection, fonds

11. p.99
FRBR에서 기록을 다루는 문제
aggregate and component entities로 취급(anthology & monograhic series와 같이)

12. p.100
도서관과 기록관의 메타데이터 연계 가능성: 전거 공유 측면에서

13. p.101
CIDOC CRM - EAD 맵핑: 참고 16번(p.102)

14. p.103
FRBR의 work의 개념이 유물 중심의 유형에는 맞지 않음.
-FRBR과 CCO에서 다루는 work의 개념이 다름

15. p.104
FRBR과 CCO를 비교할 때는 개체 그 자체보다는 관계의 차이점이 중요
- FRBR 제1집단 개체 4개를 CCO에서는 모두 work로 다루고 있음(p.105 그림 참고)

16.p.110
참고문헌 2-3번(CCO/CDWA), 11번
archival D는 p.102의 15-17번 참고

2008년 10월 13일 월요일

[도서]An Introduction to FRBR by Arlene G. Taylor(In Understanding FRBR )

An Introduction to FRBR
by Arlene G. Taylor(In Understanding FRBR pp.1-19)
In Understanding FRBR Edited by Arlene G. Taylor.

check point

1. pp.5-6.
FRBR is somewhat print oriented...
- 인쇄자료 외에 다른 분야에서의 FRBR 저작과 표현형 개념에 대한 문제 제기

2. pp.8-9.
For example, Cataloging Cultural Objects(CCO) has "concept" as a separate entitiy from "subject".
- CCO와 FRBR에서의 "concept"의 개념 차이
- 유사한 목록규칙이나 개념모형이라도, 사용된 용어의 개념 수준과 범위는 다를 수 있음

3. p.9
Aggregate and Component Entities
- FRBR에서 저작은 '통합'의 개념과 '부분'의 개념이 모두 포함된 것임.
- 이 경우 개별 저작으로 취급되고, W/P 관계로 연결

---- 여기까지 우선 entity 10/12

[낙서]누군가 내 블로그를 이용하고 있다


구글에서 검색하면 내 블로그가 아니라,
내 블로그를 이용하는 다른 사이트가 뜬다.
나는 몰랐다.
랭킹도 매우 낮다.. -_-;;

2008년 7월 17일 목요일

LC 주제명 '독도' 유지

전거 레코드에 있어서 대표표목 또는 디폴트값의 선정 기준도 필요하다.
현재 기준은 '국제적' 전거데이터의 공유에는 충분하지 않은 것이다.

미국국회도서관이 '독도' 대표표기를 수정한다는 기사와 그것을 한인 사서가 보류시켰다는 의미는 최근 독도 분쟁과 연관되어 파장이 컸다.

관련기사: http://www.hani.co.kr/arti/international/america/299279.html

2008년 7월 15일 화요일

LCSH 독도표기 변경 추진

지구상의 지적생명체가 우리 '독도'를 뭐라고 부르는지 다 조사해서 전거파일을 만들고 싶다. 관련 표목을 모아 표목관 관계를 상세하게 분석하고, 왜 그런 관계들이 생겨났는지를 상세하게 풀이해 두고 싶다. 각 표목이 나타내는 시간적, 공간적, 사회적 함의를 보다 명확하게 정리하고 싶다.

관련기사
http://news.naver.com/main/read.nhn?mode=LS2D&mid=sec&sid1=104&sid2=232&oid=005&aid=0000322575

2008년 7월 7일 월요일

[도서]The bibliographic record and information technology(1997)

The bibliographic record and information technology
by Hagler, Ronald. American Library Association

p.13
The primary reason why librarians, more than other information professionals, need the conceptual(even abstract) foundation this book purports to offer is that their mandate is the broadest of the four professions. The librarian is the generalist among informaion professionals, serving information in its greatest diversity(if not necessarily at its deepert levels of meaning) equally in all disciplines in the humanities, the social sciences, and the pure and applied sciences. Those who work with the holdings of archives, gallareis, and museims publish materials collected in linraries. The aesthetic exprience of being in an museum or gallery is transferred to library users who see illustrations on the pages of art and archaeology books. The concert hall enters the library through sound recordings. An art or craft objecct held in an archive, gallery, or museum must also be identified in a library catalogue when it becomes the subject matter of a later book or article. Librarian were also the first to take interagency standardization seriously, since it is easiest for them to share and lend their materials.

[도서]Authority Control and Its Place(1984)

Authority Control and Its Place. By: Avram, Henriette D.. Journal of Academic Librarianship, Jan 1984, Vol. 9 Issue 6, p331, 5p; (AN 7816619)

전거제어의 기본 개념(근거, 기능 포함)
목록에서의 전거제어의 역할
서지정보제공기관(bibliographic utility, OCLC, RLIN, WLN, LC)에서의 전거제어 활동(및 계획)

인용. 목록의이해,2008. 277)

2008년 6월 12일 목요일

연구노트_20080612

실무과정상 기록의 평가는 선별 또는 수집을 수반한다. 그렇지만 평가와 그에 따른 선별이나 수집을 그 목적에 비추어 동일시 할 수 없다는 견해도 있다. 콕스는 평가의 목적은 평가 근거에 관한 충분한 기술(記述)에 있으며 평가의 목적이 수집이라고 할 수는 없다고 하였다.3)이는 사회적으로 다원화된 다양한 이해관계가 존재하는 상황에서 기록가치의 상대성을 전제로 하여 평가 내역의 설명책임(accountable)을 지향한 접근이라고 할 수 있다. 이렇게 본다면 평가의 본질은 기록이 지닌 의미나 가치에 대한 판단과 그에 대한 기록화(documentation)이며, 이에 비해 선별과 수집의 본질은 평가 결과를 실현하는 의사결정 과정이될 것이다.

3) Cox, Richard, “The End of Collecting: Toward a New Purpose for Archival Appraisal,”Archival Science Vol 2, No.3 4 2002, pp.287-309

-- 이승억. 2006. 기록 평가선별 결정 분석에 관한 연구 39쪽에서 발췌

2008년 5월 8일 목요일

보존메타데이터 (preservation metadata) - "A Design of Preservation Metadata for Digital Images - Focused on the Yonsei Archives"

Preservation Metadata
"A Design of Preservation Metadata for Digital Images - Focused on the Yonsei Archives"

1. English version(abstract and keywords):

1) ABSTRACT

The Purpose of this study is to construct preservation metadata for small archival repositories focused on digital images. The study include analysing the structure and elements of the preservation metadata for digital images and extracting the element of metadata based on a National Library of New Zealand preservation metadata. NLNZ provides metadata structure and elements with simple version, metadata extractor and the whole archival system framework. And it is possible to link with other standard(i.e. OAIS, PREMIS).

2) keyword : preservation metadata, digital images, National Library of New Zealand(NLNZ), metadata extractor

2. Korean version(발표자료, 초록, 키워드):

1) 발표자료: Click here!

2) 초 록
본 연구에서는 연세대학교 기록보존소에서 소장하고 있는 배민수컬렉션의 디지털 이미지 기록정보를 대상으로 보존메타데이터의 추출부터 관리까지의 절차를 제시하였다. 보존메타데이터는 뉴질랜드 국립도서관에서 제시한 보존 메타데이터 구조와 요소, 추출 프로그램을 이용하였다. 이 표준은 포괄적이면서도 필수 요소를 중심으로 구성하였고, OAIS나 PRMIS와 같은 국제표준과 호환도 가능한 장점이 있다.

3) 키워드 : 디지털 이미지, 보존 메타데이터, 연세대학교 기록보존소, 배민수 컬렉션, 뉴질랜드 국립도서관 보존 메타데이터, 메타데이터 추출기

3. Japanese version(ppt, abstract, keyword):

1) ppt: Click here!

平成19年度 西日本図書館学会秋季日韓交流発表会
延世大学校文献情報学研究科 博士課程 朴 志英
2007年12月01日(土)
於:山口県防府市ルルサス防府多目的ホール

2) Abstract

この研究では延世大学文書館のデジタルイメージ情報を対象に保存メタデータをデザインから管理するまでの 手続きを提案した。この保存メタデータは 延世大学文書館だけではなく、これからの他の機関との協力も考えて相互互換性も考慮したし、 延世大学文書館に 所蔵である他のメタデータとともに管理できるようにした。メタデータモデルと要素はニュージーランドの国立図書館の標準を活用したし、技術(technical)メタデータを xmlフォーマットで抽出して、既存目録データベースと一緒に管理するように具現した。

3) Keywords

ディジタルイメージ、保存メタデ-タ、延世大学文書館、記錄保存所、裴敏洙(ペミンス)コレクション、ニュージーランドの国立図書館、メタデータ、metadata extractor

2008년 5월 2일 금요일

온톨로지 개발을 위한 일반 지침(Ontology Development 101: A Guide to Creating Your First Ontology)

도서관 연구소 웹진 Now@Library vol. 14(2008.4.30)


온톨로지 개발을 위한 일반 지침
(Ontology Development 101: A Guide to Creating Your First Ontology)
By Natalya F. Noy and Deborah L. McGuinness

<목차>
1. 온톨로지 개발 필요성

2. 온톨로지란 무엇인가?

3. 지식-공학 방법론


4. 클래스와 클래스 계층구조의 정의
4.1 정확한 클래스 계층구조의 반영

4.2 클래스 계층 구조에서 동위관계 분석
4.3 다중 상속
4.4 클래스의 생성 시기
4.5 클래스 생성 vs 속성 값
4.6 클래스 vs 개별 사례
4.7 범위 제한
4.8 서로소인 하위 클래스


5. 속성에 대한 상세 정의
5.1 역슬롯
5.2 기본값

6. 온톨로지 구성요소의 명명 방식
6.1 대문자 표기 vs 구분 문자 사용
6.2 단수 또는 복수
6.3 접두사와 접미사 사용 규정
6.4 기타 고려사항

7. 기타 정보원

8. 결론

참고문헌

2008년 1월 18일 금요일

Text Categorization 관련 논문 요약

아래 글은 2006년도 2학기 색인초록이론연구(연세대학교 문헌정보학과, 정영미교수님) 수업시간에 다루었던 논문에 대한 정리입니다.

1. A Comparative Study on Feature Selection in Text Categorization
- Yiming Yang, Jan O. Pedersen

[초록]
텍스트범주화의 통계적 학습에서 자질선정방법의 비교연구 - 자질 축소에 초점
5개의 방법이 평가되었음
- 문헌빈도(DF), 정보획득량(IG), 상호정보량(MI), 카이제곱(CHI), 용어강도(TS)
- 카이제곱과 정보획득량이 가장 효과적이었음
- IG 기준치는 k 최근접 이웃 분류기와 로이터 문헌집단을 이용했음. 98%까지 용어를 제거했는데, 분류 정확도가 향상되었음.
- DF 기준치도 유사했음
- DF, IG, CHI 용어 가중치가 비슷했으므로 비용문제가 있을 경우에는 가장 간단하고 비용도 적게 드는 DF가 좋음
- TS는 비교적 50%까지 자질을 축소했을 경우에 괜찮았는데, 축소 비율이 높아지면 경쟁력이 떨어짐
- 반대로, MI는 성능이 안 좋았는데, 저빈도를 선호하기 때문임
(정보검색에서는 DF가 낮은 용어의 상대적 정보량을 크게 보는데, 텍스트 범주화에서는 정보량이 거의 없다고 보기 때문에)

1.1. 분류기: kNN과 LLSF
- 선정이유: 성능이 좋은 분류기라서, 대량문헌 분류에 적합해서, LLSF는 선형, kNN은 비선형 분류기라 분류기에 따른 결과값 차이를 줄일 수 있음
1.2. 실험집단: Reuters-22173과 OSUMED 컬렉션 사용
- 선정이유: 두 집단의 분야(뉴스, 의학)와 크기(OSUMED가 큼)가 다름
1.3. 성능평가: 정확률과 재현률로 수행
1.4. 결과분석
- IG와 CHI는 kNN과 LLSF에서 모두 정확성을 상실하지 않는 축소가 가능
- TS는 50~60% 용어 제거 시점에서 최대값을 가짐
- MI는 희귀어에 대한 편향과 통계적 에러에 민감해서 성능이 낮음
- 기존 개념과 달리 DF가 높은 용어가 텍스트 범주화에는 의미가 있음

2008년 1월 17일 목요일

[Article]An Experimental Study on the Construction of Multidimensional thesaurus

[Article in Journal of Knowledge Processing and Management]
다차원 시소러스 구축에 관한 실험적 연구▶ full text(PDF)
박지영, 김태수

ABSTRACT
The Purpose of this study is to construct a multidimensional thesaurus basedon the concept definition and facet classification. The subject field of thisthesaurus is zymurgy, specifically beer brewage, since brewing words are soconcrete that they can be analyzed more precisely within their characteristics. Theconcept was analyzed for conceptual modeling, according to the internationalstandard(ISO 704: 2000(E)) and categorized into the basic categories, facets, andisolated by colon classification. After these process, a terminological database wasconstructed and characteristics were manipulated in order to sort and representthe conceptual relationships. By sorting or categorizing the characteristics in theterminology database with various criteria, we can dynamically show thehierarchical structures and conceptual relationships. This enables us to assignthe concepts to various categories according to their characteristics and constructa multidimensional concept system and reduce the confusion within the complexconceptual relationships. Moreover we can transform the representation of theconcept system according to the purposes or needs of the thesaurus user.

keyword : multidimensional thesaurus, subject indexing, knowledge organization,facet analysis, terminology

초록
본 연구의 목적은 개념정의를 이용해 용어가 가지는 속성을 추출하고, 패싯분류 체계를 이용해 디스크립터의 범주를 표현할 수 있는 시소러스를 구축하기 위한 것이다. 구축 과정에서는개념의 범위를 명확히 하기 위해 대상 용어를 양조학 분야로 한정했으며, 이 중에서도 일상생활에 친숙한 맥주 용어를 디스크립터후보로 선정하였다. 개념 분석 모델로는 국제표준인ISO 704:2000(E)를 이용하였고, 패싯분류에서는 기본패싯과 하위 구분지를 적용시켰으며, 분류된 데이터는 용어데이터베이스로 구축한 뒤 웹에서 검색할 수 있도록 만들었다. 따라서 본 시소러스는 각 용어마다 다른 언어형식으로 표현된 개념을 정규화시켜 제시함으로써 개념 간의 관계 설정이 가능하도록했으며, 각 디스크립터를 기본패싯과 구분지로 묶어서 각 개념의 계층관계를 밝힐 수 있고, 시소러스 사용자의 관점에 따라 적합한 상위어와 하위어 집단을 수시로 변경해서 추출할 수 있다. 따라서 시소러스를 사용하는 목적이나 필요성에 따라 변형되는 개념체계를 다차원적으로 표현할 수 있는 장점을 갖는다.

키워드
다차원 시소러스, 주제 색인, 지식의 구조화, 패싯분류, 전문용어