AI and Library Cataloguing: How Artificial Intelligence Is Changing Metadata Work

← Scientific Papers, Open Science, and Citizen Science: What a Viral Debate Reveals About the Future of Research Communication Webinar Joining Links: AI Agents and Workflows: Opportunities and Challenges for Education, taking place on the 24th June →

Изкуствен интелект и библиотечна каталогизация: как ИИ променя работата с метаданни

Plamen Miltenoff

Most library users never think about cataloguing.

They search the catalogue, find a book, and borrow it.

Behind this simple process lies a large amount of work. Every new book, journal, ebook, or digital resource needs a detailed record. Librarians must describe the item, assign subject headings, add classification numbers, and create metadata that helps people find the resource later.

For decades, this work has been accurate but time-consuming. Many libraries face cataloguing backlogs because staff cannot process materials as quickly as they arrive.

This is where artificial intelligence is beginning to help.

The recent infographic “AI Tools Transforming Library Cataloguing & Metadata” highlights several practical tools that are already being used in libraries.

What exactly are these tools doing?

Think of cataloguing as creating a digital identity card for a book.

Traditionally, a librarian reads information from the book and manually enters data into a library system. AI can now assist with many of these repetitive steps.

One example is OCLC WorldShare Record Manager and Connexion AI. These tools use the vast WorldCat database to suggest classifications and subject headings. Instead of starting from scratch, librarians receive recommendations able save significant time while improving consistency.

Another interesting tool is MarcAI. It uses technologies such as Optical Character Recognition (OCR), computer vision, and natural language processing.

In simple terms, the software can “look” at a book cover, title page, PDF, or other text and automatically generate a MARC record. MARC is the standard format libraries use to store bibliographic information.

A librarian can upload images or documents and receive a draft cataloguing record within seconds.

Custom GPTs designed for library systems such as Koha take this idea even further.

Some tools allow librarians to photograph a book’s title page and copyright page with a smartphone. The AI reads the information, assigns classifications and subject headings, and produces a cataloguing file ready for import into the library system.

Other GPT-based tools can generate records from an ISBN number alone.

For libraries dealing with thousands of older uncatalogued materials, this can dramatically reduce the workload.

Microsoft Power Apps combined with AI offers another approach. Instead of using a ready-made cataloguing tool, libraries can create their own workflows. AI can extract information from documents, automate repetitive tasks, and connect with existing systems.

Beyond cataloguing itself, AI is also helping with subject analysis and metadata enrichment.

Tools such as Annif, developed by the National Library of Finland, automatically suggest subject terms. Library platforms such as Alma and Primo increasingly include AI features that improve metadata and search results.

Even general-purpose AI systems such as ChatGPT, Gemini, and Claude can assist librarians by suggesting keywords, drafting summaries, identifying themes, and proposing metadata fields.

Despite these advances, librarians remain essential.

AI can generate records quickly, but it does not fully understand local collections, community needs, institutional policies, or cataloguing standards. An AI may suggest a classification number or subject heading, but a librarian still needs to verify its accuracy and level of appropriateness.

The future of cataloguing is increasingly described as a partnership between librarians and AI.

The technology handles repetitive data entry, pattern recognition, and first drafts. Librarians provide professional judgment, quality control, context, and ethical oversight.

Catalogers spend less time typing metadata and more time supporting users, improving collections, teaching information literacy, and developing library services.

As AI tools continue to improve, cataloging is shifting from a manual bottleneck to a faster and more efficient process. Libraries achieving a combination of AI assistance with librarian expertise may be able to process materials more quickly, reduce backlogs, and make knowledge accessible to their communities sooner.

The goal remains the same as it has always been: helping people find the information they need. AI is simply becoming another tool that helps libraries achieve that goal more efficiently.

Source: https://www.linkedin.com/feed/update/urn:li:groupPost:16863075-7473220642276913152/

Повечето потребители на библиотеките никога не се замислят за каталогизацията.
Те търсят в каталога, намират книга и я заемат.
Зад този привидно прост процес стои огромен обем работа. Всяка нова книга, списание, електронна книга или дигитален ресурс се нуждае от подробен запис. Библиотекарите трябва да опишат документа, да определят предметни рубрики, да добавят класификационни индекси и да създадат метаданни, които помагат на хората да откриват ресурса по-късно.
В продължение на десетилетия тази работа се извършва прецизно, но изисква много време. Много библиотеки се сблъскват с натрупване на необработени материали, защото служителите не успяват да ги каталогизират толкова бързо, колкото постъпват.
Точно тук започва да помага изкуственият интелект.
Инфографиката „AI Tools Transforming Library Cataloguing & Metadata“ представя няколко практически инструмента, които вече се използват в библиотеките.
Какво всъщност правят тези инструменти?
Можем да разглеждаме каталогизацията като създаване на дигитална лична карта за една книга.
Традиционно библиотекарят преглежда информацията в книгата и ръчно въвежда данните в библиотечната система. Днес ИИ може да подпомага много от тези повтарящи се стъпки.
Един от примерите е OCLC WorldShare Record Manager и Connexion AI. Тези инструменти използват огромната база данни WorldCat, за да предлагат класификационни индекси и предметни рубрики. Вместо да започват от нулата, библиотекарите получават препоръки, които спестяват време и подобряват последователността на каталогизацията.
Друг интересен инструмент е MarcAI. Той използва технологии като оптично разпознаване на текст (OCR), компютърно зрение и обработка на естествен език.
Казано по-просто, софтуерът може да „разгледа“ корица на книга, заглавна страница, PDF файл или друг текст и автоматично да генерира MARC запис. MARC е стандартният формат, който библиотеките използват за съхраняване на библиографска информация.
Библиотекарят може да качи изображения или документи и да получи чернова на каталожен запис само за няколко секунди.
Персонализираните GPT инструменти, разработени за библиотечни системи като Koha, развиват тази идея още повече.
Някои от тях позволяват библиотекарят да снима със смартфон заглавната страница и страницата с издателските данни на книгата. ИИ прочита информацията, определя класификационни индекси и предметни рубрики и създава каталожен файл, готов за импортиране в библиотечната система.
Други GPT базирани инструменти могат да генерират записи само въз основа на ISBN номер.
За библиотеки, които работят с хиляди по-стари некаталогизирани материали, това може значително да намали натоварването.
Microsoft Power Apps в комбинация с ИИ предлага различен подход. Вместо да използват готов инструмент за каталогизация, библиотеките могат да създават собствени работни процеси. ИИ може да извлича информация от документи, да автоматизира повтарящи се задачи и да се свързва със съществуващи системи.
Освен в самата каталогизация, ИИ подпомага и предметния анализ и обогатяването на метаданни.
Инструменти като Annif, разработен от Националната библиотека на Финландия, автоматично предлагат предметни термини. Библиотечни платформи като Alma и Primo все по-често включват ИИ функции, които подобряват метаданните и резултатите от търсене.
Дори универсални системи като ChatGPT, Gemini и Claude могат да подпомагат библиотекарите чрез предлагане на ключови думи, създаване на резюмета, откриване на теми и подготовка на проектни метаданни.
Въпреки тези възможности ролята на библиотекарите остава незаменима.
ИИ може бързо да създава записи, но не разбира напълно местните колекции, нуждите на общността, институционалните политики или специфичните каталожни практики. Той може да предложи класификационен индекс или предметна рубрика, но библиотекарят трябва да провери тяхната точност и приложимост.
Затова бъдещето на каталогизацията все по-често се описва като партньорство между библиотекарите и изкуствения интелект.
Технологията поема повтарящото се въвеждане на данни, разпознаването на модели и създаването на първоначални чернови. Библиотекарите осигуряват професионална преценка, контрол на качеството, контекст и етичен надзор.
Така каталогизаторите могат да отделят по-малко време за въвеждане на метаданни и повече време за работа с потребители, развитие на колекциите, обучение по информационна грамотност и създаване на нови библиотечни услуги.
С усъвършенстването на ИИ инструментите каталогизацията постепенно се превръща от бавен и трудоемък процес в по-бърз и по-ефективен работен поток. Библиотеките, които успешно съчетават помощта на ИИ с експертните знания на библиотекарите, могат да обработват материалите по-бързо, да намаляват натрупаните изоставания и да правят знанието достъпно за своите общности по-рано.
Основната цел остава същата, каквато е била винаги: да се помогне на хората да откриват нужната информация. Изкуственият интелект просто се превръща в още един инструмент, който помага на библиотеките да постигат тази цел по-ефективно.

https://www.linkedin.com/feed/update/urn:li:groupPost:16863075-7473220642276913152/