Określanie treści ma miejsce, gdy osoba, grupa lub program decyduje, jakie informacje należy włączyć lub wyłączyć w dokumencie lub tekście. Wiąże się to z koncepcjami otaczającymi strukturyzację dokumentów. Jest to również związane z generowaniem języka naturalnego i lingwistyką obliczeniową. Każdy obszar badań wykorzystuje określanie treści, aby sprawdzić, w jaki sposób wybierane są informacje.
Rozważając, co umieścić w dokumencie lub tekście, kompilator przeprowadził swoje badania lub otrzyma wszystkie dostępne dane. Określanie treści obejmuje sposoby ograniczania tych informacji do ostatecznego dokumentu. Odbywa się to poprzez określenie, jaki jest kąt lub cel tekstu i jakie informacje w tekście są do tego istotne.
Drugim aspektem określania treści jest jej styl. Zależy to zwykle od charakteru grupy docelowej. Intelekt odbiorców i znajomość tematu zmienią gęstość leksykalną i złożoność przekazywanych informacji. Na przykład naukowcy mają tendencję do tworzenia gęstszych tekstów niż magazyny plotkarskie. Inne rozważania obejmują rozmiar formatu, niezależnie od tego, czy będzie to książka, artykuł, czy wiadomość tekstowa.
Każdy stan określania treści jest wykonywany przez człowieka. Jest badacz i pisarz, często, choć nie zawsze, ta sama osoba, a następnie redaktor lub redaktorzy. Każdy poziom ma opinię na temat tego, jaka treść jest istotna dla celu tekstu. Językoznawcy obliczeniowi i inżynierowie komputerowi szukali sposobów na odtworzenie tego systemu za pomocą programów komputerowych, zamiast polegać na ludziach.
Istnieją trzy techniki obliczeniowe stosowane przez komputery w zakresie określania treści. „Technika schematu” opiera się na badaniu tekstów pisanych. Wykorzystuje wstępnie przeanalizowane teksty jako podstawę do tego, jakie informacje należy zawrzeć w tworzonym tekście. Metoda „statystyczna” automatycznie określa zawartość na podstawie szeregu ogólnych statystyk. „Jasne rozumowanie” wykorzystuje sztuczną inteligencję (AI) do badania i filtrowania informacji.
Ogólnym celem określania treści jest zrozumienie, w jaki sposób tworzone są dokumenty, aby można je było odtworzyć za pomocą komputerów. Efektem takiego sukcesu będzie komputer, który będzie mógł odbierać dane, filtrować je i tworzyć zestawienia najważniejszych informacji. Komputer oprze takie dokumenty nie tylko na informacjach, ale także na celach tworzonego tekstu. W duchu teorii pokoju chińskiego może to oznaczać, że komputer jest w stanie zrozumieć dane, a nie replikować i obliczać.