About: Information extraction

Not logged in : Login

(Sponging disallowed)

Facets (new session)
Description
Metadata
Settings
- Rule:
- Inverse Functional Properties:
- "Same As":

About: Information extraction Goto Sponge NotDistinct Permalink

An Entity of Type : schema:CreativeWork, within Data Space : linkeddata.uriburner.com:28898 associated with source document(s)

Information extraction (IE) is the task of automatically extracting structured information from unstructured and/or semi-structured machine-readable documents and other electronically represented sources. In most of the cases this activity concerns processing human language texts by means of natural language processing (NLP). Recent activities in multimedia document processing like automatic annotation and content extraction out of images/audio/video/documents could be seen as information extraction , from an online news sentence such as:

Attributes	Values
type	CreativeWork - Schema.org Type
label	Extracción de la información (es) Extrakce informací (cs) Information extraction (en) Informationsextraktion (de) Informationsextraktion (sv) Informazio erauzketa (eu) استخراج المعلومات (ذكاء اصطناعي) (ar) Εξαγωγή πληροφοριών (el) Извлечение информации (ru) 信息抽取 (zh) 情報抽出 (ja)
comment	信息抽取（Information Extraction，簡稱IE，又譯資訊擷取技術）主要是從大量文字資料中自動抽取特定訊息（Particular Information），以作為資料庫存取（Database Access）之用的技術。信息抽取的一個廣泛目標是允許對以往非結構化的資料去做計算，具體來說就是要允許邏輯推理能對輸入資料的邏輯內容可以舉一反三。其意義在於決定了例如在網際網路上其非結構化（例：不包含元數據）形式中有用資訊數量的成長。在這方面的技術上是透過轉換到關係形式或是經由XML標籤的標記來達到更多的可存取性──一個智慧型代理程序，監督一新聞資料饋流，需要資訊擷取技術來轉換非結構化資料到某種可推論的方式。 (zh) استخراج المعلومات (آي أي) هو نوع من استرجاع المعلومات التي تهدف إلى استخراج تلقائيا من الوثائق غير المهيكلة ، بشكل عام استخراج المعلومات المهيكلة من نصوص اللغات البشرية عن طريق معالجة اللغة الطبيعية. ونظرا لصعوبة المشكلة، فإن النهج الحالي لاستخراج المعلومات هو التركيز على مجالات محدودة ضيقة. ومن الأمثلة على ذلك هو الاستخراج من تقارير وكالات الأنباءمن عمليات الدمج بين الشركات، كما توضح العلاقة التالية: دمج_بين(الشركة_1، الشركة_2، تاريخ)، من الجملة الأخبارية على الإنترنت مثل: امس، أعلنت شركة غزل النسيج المحدودة عن حصولها على شركة الاقطان العربية. (ar) Extrakce informací (anglicky information extraction; IE) je typ vyhledávání informací, jehož cílem je automaticky vypsat strukturované nebo polostrukturované informace z nestrukturovaných strojově čitelných dokumentů. Typickým příkladem IE je skenování sérii dokumentů napsaných v přirozeném jazyce a se získanými informacemi zaplnění databáze. Aktuální přístup k IE využívá techniky zpracování přirozeného jazyka, ta těží na velmi omezených oblastech. Například Message Understanding Conference (MUC) je mítinkově založená konference, která se soustředí na oblasti v minulosti: (cs) Informationsextraktion (engelska Information Extraction) innebär inom informationsteknik att information i datorlagrad form läses ut med hjälp av olika tekniker och teknologier. Informationsextraktion är ett med informationssökning närbesläktat forskningsområde inom informationsåtkomst och språkteknologi. Informationsextraktion bygger på automatisk textförståelse, men förståelse bara av ett begränsat ämnesområde. Eftersom mänskliga språk är variationsrika är informationsextraktion svår att utföra med både god täckning och god precision. Om användaren kan finna sig i lägre täckning ger dock informationsextraktionssystem idag mycket god precision och höga prestanda. Forskningsområdet är ett av de första viktiga tillämpningsområdena för språkteknologi och har i hög grad definierats genom konf (sv) Informazio erauzketa (ingelesez, Information Extraction edo IE) informatikaren alor bat da, ordenagailu batek irakur ditzakeen dokumentuetatik informazio zehatz batzuk formatu egituratu edo erdi-egituratuan ateratzea helburu duena. Bilatutako informazioa edukiko duten esaldi mota batzuk detektatzeko patroiak eta tresna sintaktiko-semantikoak erabiltzen dira entitate, erlazio edota gertaerei buruzko informazioa lortzeko, domeinu mugatu baten dokumentuen artean. Domeinu batzuk hauek dira: enpresa-erabakiak, administrazioa, medikuntza, sal-erosketak, zaintza teknologikoa, (opinion mining), militarra... Gehienetan Intranet mailan erabiltzen da, dokumentu multzo mugatu baten gainean, bilaketa eremua ez da izaten Internet osoa. (eu) La extracción de la información (de sus siglas en inglés IE, Information Extraction) es un tipo de recuperación de la información cuyo objetivo es extraer automáticamente información estructurada o semiestructurada desde documentos legibles por una computadora. El objetivo es procesar estos documentos con un software de procesamiento de lenguaje natural (NLP) para extraer información útil de ellos. Esta tarea es muy compleja ya que estos programas suelen operar con unos dominios muy restringidos. Lo que dificulta extraer la información de textos con un lenguaje poco formal o imágenes. (es) Unter Informationsextraktion (engl. Information Extraction, IE) versteht man die ingenieursmäßige Anwendung von Verfahren aus der praktischen Informatik, der künstlichen Intelligenz und der Computerlinguistik auf das Problem der automatischen maschinellen Verarbeitung von unstrukturierter Information mit dem Ziel, Wissen bezüglich einer im Vorhinein definierten Domäne zu gewinnen. Ein typisches Beispiel ist die Extraktion von Informationen über Firmenzusammenschlüsse (engl. merger events), wobei etwa aus Online-Nachrichten Instanzen der Relation merge(Firma1, Firma2, Datum) extrahiert werden. Der Informationsextraktion kommt eine große Bedeutung zu, da viele Informationen in unstrukturierter (nicht relational modellierter) Form vorliegen, zum Beispiel im Internet, und dieses Wissen durch (de) Извлечение информации (англ. information extraction) — это задача автоматического извлечения (построения) структурированных данных из неструктурированных или слабоструктурированных машиночитаемых документов. * MUC-1 (1987), MUC-2 (1989): Военно-морские операции. * MUC-3 (1991), MUC-4 (1992): Терроризм в латиноамериканских странах. * MUC-5 (1993): Венчурные операции в области микроэлектроники. * MUC-6 (1995): Новостные статьи об изменениях в управляющих процессах. * MUC-7 (1998): Отчёты о запусках спутников. Типичные подзадачи извлечения информации: (ru) 情報抽出 (Information Extraction; IE) は非構造化文書と機械が読み取れる (machine-readableな) 半構造化文書の両方またはいずれから自動的に構造化データを抽出するタスクである。多くの場合、この作業は人間の言葉で書かれた文書を自然言語処理 (Natural Language Processing; NLP) の手法を用いて処理することを指す。画像・音楽・動画の自動アノテーションやコンテンツ抽出のような、近年のマルチメディア文書の処理もまた情報抽出として捉えられる。その問題の難しさから、IEに対する現在のアプローチは狭く制限されたドメインに焦点を当てている。例として、ニュースサービスの企業合併についての報道からの情報抽出があり、次のようなフォーマルな関係による情報 , を次のようなニュース文 "Yesterday, New York based Foo Inc. announced their acquisition of Bar Corp." から抜き出す。 IEの広い目標は、蓄積された非構造化データのうえで処理を行えるようにすることである。より具体的な目標は、入力データの論理的内容に基づいて推論を行う論理的推論を可能にすることである。 (ja) Η εξαγωγή ή εξόρυξη πληροφοριών είναι ένα είδος ανάκτησης πληροφοριών από μη ή ημιδομημένα δεδομένα (unstructured or semi-structured data – τυπικά κείμενα γραμμένα σε φυσική γλώσσα, ιστοσελίδες κ.α.) και αποτελεί κλάδο της σύγχρονης Επιστήμης των υπολογιστών. Είναι βασισμένη στην τεχνολογία της Επεξεργασίας του φυσικού λόγου. (el) Information extraction (IE) is the task of automatically extracting structured information from unstructured and/or semi-structured machine-readable documents and other electronically represented sources. In most of the cases this activity concerns processing human language texts by means of natural language processing (NLP). Recent activities in multimedia document processing like automatic annotation and content extraction out of images/audio/video/documents could be seen as information extraction , from an online news sentence such as: (en)
sameAs	Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction Information extraction
topic	dbpedia:Comparison_shopping_website [DBpedia Spotlight Annotator] Business Intelligence Amit Sheth dbpedia:Ontology_(information_science) DBpedia dbpedia:Andrew_McCallum dbpedia:Daniel_S._Weld dbpedia:Rohini_Kesavan_Srihari dbpedia:Outline_of_library_science dbpedia:Text_mining dbpedia:Concept_search dbpedia:Datalog dbpedia:Entity_linking dbpedia:List_of_SRI_International_people dbpedia:Ontology_learning dbpedia:Outline_of_artificial_intelligence dbpedia:Terminology_extraction dbpedia:WordNet dbpedia:Collaborative_filtering dbpedia:Data-centric_programming_language dbpedia:Data-intensive_computing dbpedia:Data_mining dbpedia:Information_filtering_system dbpedia:András_Kornai dbpedia:Natural_language_processing dbpedia:AUTINDEX dbpedia:Automatic_summarization dbpedia:Center_for_Intelligent_Information_Retrieval dbpedia:Cheminformatics dbpedia:Cross-language_information_retrieval dbpedia:DARPA_TIPSTER_Program dbpedia:Evaluation_of_binary_classifiers dbpedia:Faceted_search dbpedia:International_Conference_on_Computational_Linguistics_and_Intelligent_Text_Processing dbpedia:Language_Technologies_Institute dbpedia:Legal_informatics dbpedia:NooJ dbpedia:SemEval dbpedia:Semantic_parsing dbpedia:Stop_word dbpedia:Supervised_learning Knowledge extraction dbpedia:Timeline_of_artificial_intelligence dbpedia:Enterprise_search dbpedia:Text_graph dbpedia:Truth_discovery dbpedia:Jerry_Hobbs dbpedia:Data_scraping dbpedia:Full-text_search dbpedia:Natural-language_understanding dbpedia:Abstract_interpretation dbpedia:Apache_Lucene dbpedia:Apache_Nutch dbpedia:Apache_cTAKES dbpedia:Artur_d'Avila_Garcez dbpedia:Automatic_content_extraction dbpedia:Automatic_taxonomy_construction dbpedia:BioCreative dbpedia:Biomedical_text_mining

Faceted Search & Find service v1.17_git151 as of Feb 20 2025

Alternative Linked Data Documents: iSPARQL | ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 08.03.3332 as of Mar 17 2025, on Linux (x86_64-generic-linux-glibc25), Single-Server Edition (378 GB total memory, 19 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2025 OpenLink Software