Pamoka: „Teksto informacija“

Tekstas kaip informacijos pateikimo forma

Tekstas yra bet koks žodinis pareiškimas, atspausdintas, rašytinis arba egzistuojantis žodžiu.

Informacija, pateikta raštu, vadinama tekstinė informacija.

Nuostabus faktas!Praleidus, pakeitus ar pertvarkant bent vieną simbolį tekste, kartais pasikeičia jo reikšmė:

Kas atėjo pas mus! (reikšmė ta, kad įėjęs asmuo buvo matytas ir atpažintas)

Kas atėjo pas mus? (yra klausimas, pabrėžiantis situacijos neapibrėžtumą ir neapibrėžtumą).

Tūkstančius metų žmonės fiksavo informaciją.

Informacijos laikikliai: akmuo, molis, medis, papirusas, pergamentas, popierius.

Tačiau norint pakeisti tekstą, jį reikėjo perrašyti. Ir tai yra labai ilgas ir daug pastangų reikalaujantis procesas. Kompiuterių atsiradimas pakeitė rašymo technologiją. Specialiomis kompiuterinėmis programomis galima įvesti bet kokį tekstą, prireikus jį keisti, įrašyti tekstą į kompiuterio atmintį ilgalaikiam saugojimui, spausdinti spausdintuvu bet kokį kopijų skaičių, išsiųsti tekstą naudojant El. paštasį kitus kompiuterius.

Tekstiniai dokumentai

Dokumentas – bet koks tekstas, sukurtas naudojant teksto redaktorius, kartu su į jį įtraukta netekstine medžiaga.

Tekstinis dokumentas gali būti:

Hipertekstas – tai būdas sutvarkyti dokumentą, kad jį būtų galima greitai rasti. reikalinga informacija . Perėjimas iš vienos hiperteksto vietos į kitą vyksta nuorodų pagalba.

Pavyzdys: Jūs skaitote enciklopediją apie gyvūnus ir jus ypač domina informacija apie šunis. Tebūnie pabrauktas žodis „aviganis“ – tai reiškia nuorodą hipertekste. Jei spustelėsite šį žodį pele, pateksite į kitą enciklopedijos straipsnį, kuriame kalbama apie šią šunų veislę.

Pagrindiniai tekstinio dokumento objektai yra šie: simbolis, žodis, eilutė, pastraipa, puslapis, fragmentas.

Simbolis - skaičius, raidė, skyrybos ženklas ir kt.

Žodis – savavališka simbolių seka, kurią iš abiejų pusių riboja aptarnavimo simboliai (tarpas, skliaustai, kablelis ir kt.).

Linija – savavališka simbolių seka tarp kairiosios ir dešiniosios dokumento kraštinės.

Pastraipa – savavališka simbolių seka, apribota specialiais simboliais pastraipos pabaigoje.

Fragmentas yra savavališka simbolių seka. Fragmentas gali būti vienas žodis, eilutė, pastraipa, puslapis ar net visas įvedamas tekstas.

Kompiuteris yra pagrindinė tekstų rengimo priemonė

Įdiegta bet kuriame kompiuteryje specialios programos, skirtas tekstams kurti, - teksto redaktoriai .

Kurti ir kurti istorijas, ataskaitas, straipsnius mokyklos laikraštis su užrašais, lentelėmis, diagramomis, brėžiniais, nuotraukomis, naudokite galingesnius teksto redaktorius. Jie taip pat vadinami tekstų rengyklėmis.

Vieno iš paprastų tekstų rengyklės langas parodytas fig. 24 p.58.

Dokumento rengimas kompiuteriu susideda iš kelių etapų:įvestis (rinkinys)tekstą , redagavimas , formatavimas irantspaudas.

Teksto įvedimas

Įvesdami tekstą atminkite šiuos dalykus.taisykles:

    Jei reikia, naudokite didžiąsias raides.

    Visi skyrybos ženklai, išskyrus brūkšnį, turi būti dedami iškart po paskutinės žodžio raidės; Po bet kurio skyrybos ženklo paspauskite tarpo klavišą. Abiejose pusėse pabrėžkite brūkšnelius su tarpais.

    Venkite įvesti dviejų ar daugiau tarpų iš eilės; nenaudokite tarpo pastraipų riboms lygiuoti.

    Nežiūrėkite eilutės pabaigos: kai tik ji bus pasiekta, žymeklis automatiškai pereis į kitos eilutės pradžią.

    Norėdami įvesti naują pastraipą, paspauskite klavišąĮeikite.

Jei nustatysite nespausdinamų simbolių rodymo režimą, bus daug lengviau kontroliuoti, kaip laikomasi spausdinimo taisyklių.

Teksto redagavimas

Redagavimas - tai kitas dokumento rengimo etapas, kuris prasideda po informacijos įvedimo, ko pasekoje patikrinamas dokumento teisingumas ir ištaisomos rastos klaidos bei atliekami reikiami pakeitimai.

Naudojant žymeklio rodykles, žymeklį galima perkelti visame ekrane, perkeliant jį į bet kurį simbolį. Norint judėti visame dokumente, yra skirti specialūs klavišai arba klavišų kombinacijos (žr. vadovėlį, p. 59).

Redaguodami galite dirbti ne tik su atskirais simboliais, bet ir su visais teksto fragmentais. Pirmiausia reikia pasirinkti fragmentą. Norėdami tai padaryti, užveskite pelės žymeklį į norimo fragmento pradžią ir, laikydami nuspaudę pelės mygtuką, vilkite žymeklį iki galo. Tekstas paryškintas kontrastinga spalva. Fragmento pasirinkimą galima atšaukti spustelėjus bet kurią lango darbo srities vietą.

Teksto formatavimas

Formatavimas - tai vienas iš dokumento rengimo etapų, kurio metu atliekamos įvairios dokumento surašymo operacijos.

Pastraipų lygiavimas:

Šriftas yra pilna komplektacija abėcėlės raidės su bendru jų įvaizdžio stiliumi.

Šrifto stilius:

Norėdami spausdinti dokumentą ant popieriaus, prie kompiuterio prijungiamas spausdintuvas -Spausdintuvas.

Unikodas- simbolių kodavimo standartas, leidžiantis pavaizduoti beveik visų rašytinių kalbų ženklus.
Standartą 1991 m. pasiūlė ne pelno organizacija „Unicode Consortium“. Šio standarto taikymas leidžia užkoduoti labai didelis skaičius simboliai iš skirtingų raštų: kinų rašmenys, matematiniai simboliai, graikų abėcėlės raidės, lotyniškos ir kirilicos raidės gali egzistuoti Unicode dokumentuose, o kodų puslapių perjungimas tampa nereikalingas.
Standartą sudaro dvi pagrindinės dalys: universalus simbolių rinkinys ir kodavimo šeima. Universalus simbolių rinkinys nurodo simbolių atitikimą kodams – kodo erdvės elementams, vaizduojantiems neneigiamus sveikuosius skaičius. Kodavimo šeima apibrėžia UCS kodų sekos mašininį atvaizdavimą.
Unicode standarto kodai yra suskirstyti į keletą sričių. Srityje su kodais nuo U+0000 iki U+007F yra ASCII simbolių su atitinkamais kodais. Toliau – įvairių raštų simbolių, skyrybos ženklų ir techninių simbolių sritys. Kai kurie kodai yra rezervuoti naudoti ateityje. Pagal kirilicos simbolius skiriamos simbolių sritys su kodais nuo U + 0400 iki U + 052F, nuo U + 2DE0 iki U + 2DFF, nuo U + A640 iki U + A69F (žr. kirilicą Unikode).

Kodavimo sistema

Universali kodavimo sistema (Unicode) yra grafinių simbolių rinkinys ir būdas juos užkoduoti kompiuteriniam teksto duomenų apdorojimui.
Grafiniai simboliai yra simboliai, turintys matomą vaizdą. Grafiniai simboliai kontrastuojami su valdymo simboliais ir formatavimo simboliais. Grafinius simbolius sudaro šios grupės: raidės, esančios bent vienoje iš palaikomų abėcėlių; skaičiai; skyrybos ženklai; specialieji ženklai (matematiniai, techniniai, ideogramos ir kt.); separatoriai.
Unikodas yra linijinio teksto vaizdavimo sistema. Simboliai, turintys papildomų viršutinio ar apatinio indekso elementų, gali būti pavaizduoti kaip kodų seka, sukurta pagal tam tikras taisykles (sudėtinis variantas, sudėtinis simbolis) arba kaip vienas simbolis (monolitinis variantas, iš anksto sudarytas simbolis).

Modifikatoriaus simboliai
„Unicode“ grafiniai simboliai skirstomi į išplėstinius ir neišplėstus (be pločio). Neištempti simboliai, kai rodomi, neužima vietos eilutėje. Tai visų pirma apima kirčio ženklus ir kitus diakritinius ženklus. Tiek išplėstiniai, tiek nepratęsti simboliai turi savo kodus. Išplėstiniai simboliai kitaip vadinami pagrindiniais, o neišplėstiniai – modifikuojantys; o pastarieji negali susitikti savarankiškai. Pavyzdžiui, simbolis „á“ gali būti pavaizduotas kaip pagrindinio simbolio „a“ (U+0061) ir modifikatoriaus „́“ (U+0301) seka arba kaip monolitinis simbolis „á“ (U+00C1). ).
Ypatingas modifikuojančių simbolių tipas yra stiliaus variantų parinkikliai. Jie turi įtakos tik tiems simboliams, kuriems tokie variantai yra apibrėžti. 5.0 versijoje šrifto stiliai apibrėžti daugeliui matematinių simbolių, tradicinių mongolų simbolių ir mongolų kvadratinių simbolių.

Normalizavimo formos
Kadangi tie patys simboliai gali būti pavaizduoti skirtingais kodais, o tai kartais apsunkina apdorojimą, yra normalizavimo procesų, skirtų tekstui perkelti į tam tikrą standartinę formą.
Unicode standartas apibrėžia 4 teksto normalizavimo formas:
Normalizavimo forma D (NFD) yra kanoninis skaidymas. Perkeliant tekstą į šią formą, visi sudėtiniai simboliai rekursyviai pakeičiami keliais sudėtiniais ženklais, atsižvelgiant į skaidymo lenteles.
Normalizavimo forma C (NFC) yra kanoninis skaidymas, po kurio seka kanoninė kompozicija. Pirmiausia tekstas redukuojamas į D formą, po to atliekama kanoninė kompozicija – tekstas apdorojamas nuo pradžios iki pabaigos ir laikomasi šių taisyklių:
S simbolis yra pradinis, jei jo modifikavimo klasė Unicode simbolių bazėje yra nulis.
Bet kurioje simbolių sekoje, kuri prasideda pradžios simboliu S, simbolis C blokuojamas nuo S tada ir tik tada, kai tarp S ir C yra koks nors simbolis B, kuris prasideda arba turi tokią pačią ar didesnę modifikavimo klasę nei C. Tai yra taisyklė taikoma tik toms eilutėms, kurioms buvo atliktas kanoninis skaidymas.
Pirminis sudėtinis simbolis yra simbolis, kurio Unicode simbolių bazėje yra kanoninis išskaidymas (arba kanoninis išskaidymas Hangul ir kuris nėra įtrauktas į išimčių sąrašą).
Simbolis X gali būti pirminis kartu su simboliu Y tada ir tik tada, kai yra pirminis sudėtinis Z, kuris kanoniškai yra lygiavertis sekai .
Jei kito simbolio C neužblokuoja paskutinis aptiktas pradinis bazinis simbolis L ir jis gali būti sėkmingai suderintas su juo, tada L pakeičiamas L-C kompozicija, o C ištrinamas.
Normalizavimo forma KD (NFKD) yra suderinamas skaidymas. Kai perkeliama į šią formą, visi sudėtiniai simboliai pakeičiami naudojant kanoninius Unicode skaidymo žemėlapius ir suderinamus skaidymo žemėlapius, o po to rezultatas išdėstomas kanonine tvarka.
Normalizavimo forma KC (NFKC) yra suderinamas skaidymas, po kurio seka kanoninė kompozicija.

Sąvokos „sudėtis“ ir „suskaidymas“ reiškia atitinkamai simbolių sujungimą arba išskaidymą į jų sudedamąsias dalis.

Pavyzdžiai

Šaltinio tekstasNFDNFCNFKDNFKC
Francaisfrankas\u0327aisFran\xe7aisfrankas\u0327aisFran\xe7ais
A, Yo, Y \u0410, \u0401, \u0419\u0410, \u0415\u0308, \u0418\u0306\u0410, \u0401, \u0419
\u304b\u3099\u304c\u304b\u3099\u304c
Henrikas IVHenrikas IVHenrikas IVHenrikas IVHenrikas IV
Henris ⅣHenris \u2163Henris \u2163Henrikas IVHenrikas IV

Unikodas apima beveik visus šiuolaikinius scenarijus, įskaitant:
arabų, armėnų, bengalų, birmiečių, glagolitų, graikų, gruzinų, devanagarų, hebrajų, kirilicos, kinų (japonų kalboje aktyviai vartojami kinų rašmenys, o korėjiečių kalba taip pat gana retai), koptų, khmerų, lotynų, tamilų, korėjiečių (hangulų) , čerokių, etiopų, japonų (įskaitant, be kinietiški simboliai taip pat skiemens)
ir kiti.

Akademiniais tikslais buvo pridėta daug istorinių raštų, įskaitant runas, senovės graikų, egiptiečių hieroglifus, dantiraštį, majų raštą, etruskų abėcėlę.

Pristatymo metodai
Unikodas turi keletą vaizdavimo formų: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) ir UTF-32 (UTF-32BE, UTF-32LE). Taip pat buvo sukurta UTF-7 atvaizdavimo forma, skirta perduoti septynių bitų kanalais, tačiau dėl nesuderinamumo su ASCII ji nebuvo plačiai naudojama ir nebuvo įtraukta į standartą. 2005 m. balandžio 1 d. buvo pasiūlyti du anekdotai: UTF-9 ir UTF-18 (RFC 4042).
AT Microsoft Windows NT ir jos pagrindu Windows sistemos 2000 ir Windows XP dažniausiai naudoja UTF-16LE formą. Į UNIX panašios operacinės sistemos GNU/Linux, BSD ir Mac OS X naudoja UTF-8 formą failams ir UTF-32 arba UTF-8 simbolių tvarkymui RAM.

UTF-8
UTF-8 yra unikodo atvaizdas, užtikrinantis geriausią suderinamumą su senesnėmis sistemomis, kuriose buvo naudojami 8 bitų simboliai. Tekstas, sudarytas tik iš mažesnių nei 128 simbolių, konvertuojamas į paprastą ASCII tekstą, kai rašomas UTF-8. Ir atvirkščiai, UTF-8 tekste bet kuris baitas, kurio reikšmė mažesnė nei 128, reiškia ASCII simbolį su tuo pačiu kodu. Likę Unikodo simboliai pateikiami kaip sekos nuo 2 iki 6 baitų (iš tikrųjų tik iki 4 baitų, nes Unikode nėra simbolių, kurių kodas didesnis nei 10FFFF, ir neplanuojama jų įvesti ateityje ), kuriame
pirmasis baitas visada yra 11xxxxxx, o likęs 10xxxxxx.
UTF-8 formatą 1992 m. rugsėjo 2 d. išrado Kenas Thompsonas ir Robas Pike'as ir įdiegė 9 plane. UTF-8 standartas dabar oficialiai įtrauktas į RFC 3629 ir ISO/IEC 10646 D priedą.
UTF-8 simboliai gaunami iš Unicode taip:

Unicode UTF-8: 0x00000000 -xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx Baitų tvarka
UTF-16 duomenų sraute aukštas baitas gali būti parašytas arba prieš žemą baitą, arba po žemo baito. Panašiai yra du keturių baitų kodavimo variantai - UTF-32BE ir UTF-32LE.
Norint nustatyti Unicode vaizdavimo formatą, teksto failo pradžioje įrašomas parašas – simbolis U + FEFF (nepertraukiamas tarpas su nuliu pločiu), dar vadinamas baitų eilės ženklu (BOM). Tai leidžia atskirti UTF-16LE ir UTF-16BE, nes U+FFFE simbolis neegzistuoja. Taip pat šis metodas kartais naudojamas UTF-8 formatui žymėti, nors pabaigos sąvoka šiam formatui netaikoma. Failai, atitinkantys šią konvenciją, prasideda šiomis baitų sekomis: UTF-8 EF BB BFUTF-16BE FE FFUTF-16LE FF FEUTF-32BE 00 00 FE FFUTF-32LE FF FE 00 00
Deja, šis metodas patikimai neatskiria UTF-16LE ir UTF-32LE, nes simbolis U+0000 leidžiamas Unicode (nors realūs tekstai retai prasideda juo).
UTF-16 ir UTF-32 užkoduoti failai, kuriuose nėra KS, turi būti dideliais baitais (unicode.org).

Unikodas ir tradicinės koduotės
Įvedus Unicode, pasikeitė požiūris į tradicines 8 bitų koduotas. Jei anksčiau kodavimas buvo nustatytas pagal šriftą, dabar jis nustatomas pagal šios koduotės ir Unikodo atitikimo lentelę. Tiesą sakant, 8 bitų kodavimas tapo tam tikra Unikodo pogrupio vaizdavimo forma. Dėl to daug lengviau kurti programas, kurios turi veikti su daugybe skirtingų koduotų: dabar, norėdami pridėti kitos koduotės palaikymą, tereikia pridėti kitą Unicode konvertavimo lentelę.
Be to, daugelis duomenų formatų leidžia įterpti bet kokį Unicode simbolį, net jei dokumentas parašytas senąja 8 bitų koduote. Pavyzdžiui, HTML galite naudoti ampersand kodus.

Įgyvendinimai
Dauguma šiuolaikinių operacinių sistemų tam tikru mastu palaiko Unicode.
Operacinėse sistemose Windows šeimos NT vidiniam failų vardų ir kitų vaizdavimui sistemos linijos naudojama dviejų baitų koduotė UTF-16LE. Sisteminių skambučių priėmimas eilutės parametrai, egzistuoja vieno ir dviejų baitų variantuose. Norėdami gauti daugiau informacijos, žr. Unicode Microsoft operacinėse sistemose.
Į UNIX panašios operacinės sistemos, įskaitant GNU/Linux, BSD, Mac OS X, naudoja UTF-8 koduotę Unicode atstovavimui. Dauguma programų gali veikti su UTF-8, kaip ir su tradicinėmis vieno baito koduotėmis, nepaisant to, kad simbolis vaizduojamas kaip keli baitai iš eilės. Norint dirbti su atskirais simboliais, eilutės paprastai perkoduojamos į UCS-4, kad kiekvienas simbolis atitiktų mašinos žodį.
Vienas iš pirmųjų sėkmingų komercinių Unicode įdiegimų buvo Java programavimo aplinka. Jis iš esmės atsisakė 8 bitų simbolių vaizdavimo ir pasirinko 16 bitų. Dauguma programavimo kalbų dabar palaiko Unicode eilutes, nors jų vaizdavimas gali skirtis priklausomai nuo įgyvendinimo.

Įvesties metodai
Kadangi joks klaviatūros išdėstymas negali leisti įvesti visų Unicode simbolių vienu metu, operacinės sistemos ir taikomosios programos turi palaikyti alternatyvius savavališkų unikodo simbolių įvedimo būdus.

Microsoft Windows
Pradedant nuo Windows 2000, simbolių žemėlapio įrankis (charmap.exe) rodo visus OS simbolius ir leidžia juos nukopijuoti į mainų sritį. Yra panaši lentelė, pavyzdžiui, in Microsoft word.
Kartais galite įvesti šešioliktainį kodą, paspausti Alt + X ir kodas bus pakeistas atitinkamu simboliu, pavyzdžiui, WordPad, Microsoft Word. Redaktoriuose Alt+X taip pat atlieka atvirkštinę transformaciją.
Daugelyje MS Windows programų, norėdami gauti Unicode simbolį, turite paspausti Alt klavišą, kad skaičių klaviatūra įvestumėte simbolio kodo dešimtainę reikšmę. Pavyzdžiui, renkant kirilicos tekstus bus naudingi deriniai Alt + 0171 (“) ir Alt + 0187 (”). Taip pat įdomūs deriniai Alt+0133 (…) ir Alt+0151 (-).

Macintosh
Skirta „Mac OS 8.5“ ir naujesnėms versijoms vėlesnės versijos palaikomas įvesties metodas, vadinamas „Unicode Hex Input“. Laikydami nuspaudę parinkčių klavišą, turite įvesti keturių skaitmenų šešioliktainį reikiamo simbolio kodą. Šis metodas leidžia įvesti simbolius, kurių kodai yra didesni nei U+FFFF, naudojant pakaitalų poras; tokios poros Operacinė sistema bus automatiškai pakeistas atskirais simboliais. Prieš naudojant šį įvesties metodą reikia suaktyvinti atitinkamame skyriuje. sistemos nustatymai tada klaviatūros meniu pasirinkite kaip dabartinį įvesties metodą.
Pradedant nuo „Mac OS X 10.2“, taip pat yra „Character Palette“ programa, leidžianti pasirinkti simbolius iš lentelės, kurioje galite pasirinkti simbolius iš konkretaus bloko arba simbolius, palaikomus tam tikro šrifto.

GNU/Linux
GNOME taip pat turi „Symbol Table“ priemonę, kuri leidžia rodyti konkretaus bloko ar rašymo sistemos simbolius ir suteikia galimybę ieškoti pagal simbolio pavadinimą ar aprašymą. Kai žinomas norimo simbolio kodas, jį galima įvesti pagal ISO 14755 standartą: laikant nuspaustą Ctrl klavišai ir Shift, kad įvestumėte šešioliktainį kodą (pradedant nuo tam tikros GTK+ versijos, prieš įvedant kodą reikia paspausti „U“ klavišą). Įvedamas šešioliktainis kodas gali būti iki 32 bitų ilgio, todėl galite įvesti bet kokį unikodo simbolį nenaudodami pakaitinių porų.
Visos X lango programos, įskaitant GNOME ir KDE, palaiko įvestį naudojant klavišą Compose. Klaviatūroms, kuriose nėra atskiro kūrimo klavišo, šiam tikslui galima priskirti bet kurį klavišą, pvz., Caps Lock.
GNU/Linux konsolė taip pat leidžia įvesti Unicode simbolį pagal jo kodą – tam dešimtainis kodas simboliai turi būti įvedami su išplėstinio klaviatūros bloko skaičiais, laikydami nuspaudę klavišą Alt. Taip pat galite įvesti simbolius pagal jų šešioliktainį kodą: norėdami tai padaryti, laikykite nuspaudę klavišą AltGr ir įveskite skaitmenys A-F naudokite išplėstinio klaviatūros bloko klavišus nuo NumLock iki Enter (pagal laikrodžio rodyklę). Taip pat palaikoma įvestis pagal ISO 14755. Kad šie metodai veiktų, turite įjungti Unicode režimą konsolėje su unicode_start(1) ir pasirinkti tinkamą šriftą su setfont(8).
„Mozilla Firefox“, skirta Linux, palaiko ISO 14755 simbolių įvestį.

Daugumos elektroninių leidinių, kaip ir spausdintinių, pagrindas yra tekstinė medžiaga. Būtent tekstui tenka pagrindinė semantinė apkrova. . Elektroninių leidinių tekstinė medžiaga gali būti ruošiama tekstų rengyklėse arba programinės įrangos paketai maketuoti ir suformatuoti pagal spaudiniams keliamus reikalavimus. Rengiantis publikavimui, kiekvienas šios programos rengia tekstinius failus savo formatu, tačiau vėlesnis spausdinimas ant kietųjų laikmenų suteikia tokias pačias teksto ir grafinės informacijos suvokimo galimybes.

Elektroniniuose leidiniuose situacija kitokia. Čia tekstinės informacijos suvokimas atliekamas remiantis bet kurios publikacijos pateikimu monitoriaus ekrane. Kadangi tokius leidinius galima rengti įvairiose programinėse aplinkose, elektroniniam dokumentui atgaminti reikia būtent šios ar kitos programiškai ir informaciniu požiūriu su ja suderinamos aplinkos. Taigi, visi labiausiai tikėtini programinė įranga elektroninių leidinių skaitymas.

Vienas iš būdų išvengti šios situacijos yra naudoti standartą teksto formatai. Tačiau šiandien yra standartai (teisiniai) tik simbolių kodavimo būdams. Todėl leidiniuose ir publikacijose elektroniniuose leidiniuose bei hipertekstiniuose elektroniniuose HTML dokumentuose naudojami ASCII ASNI kodai arba dviejų baitų UNICOD kodas. To paties požiūrio buvo laikomasi ir ruošiantis elektroninius dokumentus apie pagalbos technologijas.

„Adobe Systems“ pasiūlė savo požiūrį į elektroninių leidinių programinės įrangos ir informacijos suderinamumo problemą. Kaip standartinis (de facto) teksto formatas Pasirinktas PDF žymėjimo formatas . Taip yra dėl to, kad beveik kiekvienoje teksto rengyklės programoje ar maketavimo pakete yra dokumento, sukurto speciali programa, in PDF formatu. Todėl bet kurį elektroninį dokumentą galima pateikti viena forma (de facto PDF standartu) ir peržiūrėti Adobe Acrobat.

Daugelyje elektroninių dokumentų tekstinė medžiaga naudojama kaip komentaras į grafinius ar animacinius elektroninių leidinių elementus. Tokie elektroniniai leidiniai apima hipergrafinius ir daugialypės terpės leidinius.

Šaltinio teksto medžiaga elektroninį leidimą galima paruošti tradiciniais būdais: naudojant klaviatūros komplektą; originalaus dokumento teksto blokų nuskaitymas su vėlesniu simbolių atpažinimu atitinkamų teksto atpažinimo programų aplinkoje; perkelti į kompiuterį naudojant magnetines laikmenas; perduodama per tinklą ir kt.

Elektroniniuose dokumentuose tekstas atlieka dvejopą vaidmenį. Visų pirma, jis turi pagrindinę semantinę apkrovą daugelyje elektroninių leidinių tipų. Paprastai ši tekstinė medžiaga pateikiama teksto blokų ar skyrių pavidalu, kurie vėliau bus sujungti į kažkokį vientisumą žiūrint elektroninį leidinį ar naršant jį.

Iš kitos pusės tekstinė informacija yra pagrindinis elementas elektroniniai leidiniai, nes jie naudojami naršymui elektroninis leidimas. Ši tekstinė informacija įvedama tiesiogiai generuojant naršymo elementus.

Sukurta nemažai specialių programų elektroninių dokumentų rengimui automatizuoti.

Teksto informacija Tekstas kaip informacijos pateikimo forma Tekstiniai dokumentai Kompiuteris yra pagrindinis įrankis tekstams ruošti Teksto įvedimas Teksto redagavimas Teksto formatavimas

Raktažodžiai Teksto dokumentas Teksto rengyklė Teksto įvedimo taisyklės Redagavimas Formatavimas

Tekstas kaip informacijos pateikimo forma! Tekstas yra bet koks žodinis pareiškimas, atspausdintas, parašytas arba egzistuojantis žodžiu. Informacija, pateikiama rašytinio teksto forma, vadinama tekstine informacija.

Nuostabus faktas Praleidus, pakeitus ar perrikiavus bent vieną simbolį tekste, kartais pasikeičia jo reikšmė:

Tekstiniai dokumentai Dokumentas yra bet koks tekstas, sukurtas naudojant teksto rengyklę, kartu su jame esančia netekstine medžiaga. Tekstinis dokumentas Straipsnis Kvietimas Skelbimas Pranešimas Istorija Eilėraštis

Tekstinio dokumento objektai Pagrindiniai tekstinio dokumento objektai yra: q simbolis q žodis q eilutė q pastraipa q puslapis q fragmentas

Dokumento rengimo etapai Dokumento rengimas kompiuteriu susideda iš kelių etapų: teksto įvedimo (spausdinimo), redagavimo, formatavimo ir spausdinimo.

Teksto įvedimas Įvesdami tekstą laikykitės šių taisyklių: 1. Jei reikia, naudokite didžiąsias raides. 2. Visi skyrybos ženklai, išskyrus brūkšnį, dedami iškart po paskutinės žodžio raidės; Po bet kurio skyrybos ženklo paspauskite tarpo klavišą. Abiejose pusėse pabrėžkite brūkšnelius su tarpais. 3. Venkite įvesti dviejų ar daugiau tarpų iš eilės; nenaudokite tarpo pastraipų riboms lygiuoti. 4. Nestebėkite eilutės pabaigos: ją pasiekus, žymeklis automatiškai pereis į kitos eilutės pradžią. 5. Norėdami pereiti prie naujos pastraipos įvedimo, paspauskite klavišą Enter.

Teksto redagavimas Redagavimas – tai kitas dokumento rengimo etapas, kuris prasideda po informacijos įvedimo, ko pasekoje patikrinamas dokumento teisingumas ir ištaisomos klaidos bei atliekami reikiami pakeitimai. Pagrindinės redagavimo operacijos

Teksto formatavimas Formatavimas yra vienas iš dokumento rengimo etapų, kurio metu atliekamos įvairios dokumento formatavimo operacijos. Formatavimo operacijos

Dokumento spausdinimas Taškinės matricos rašalinis lazerinis spausdintuvas Norėdami spausdinti dokumentą ant popieriaus, prie kompiuterio prijungiamas spausdintuvas.

Svarbiausia, kad tekstas yra bet koks žodinis pareiškimas, atspausdintas, parašytas ar egzistuojantis žodžiu. Informacija, pateikiama rašytinio teksto forma, vadinama tekstine informacija. Tekstinei informacijai apdoroti skirtos specialios programos – teksto rengyklės. Bet koks tekstas, sukurtas naudojant teksto rengyklę, kartu su jame esančia netekstine medžiaga vadinamas dokumentu. Dokumento rengimas kompiuteriu susideda iš tokių etapų kaip įvedimas (spausdinimas), redagavimas ir formatavimas.

Klausimai ir užduotys? 2. Nurodykite pašalinimo algoritmus toliau nurodytos klaidos. Papildomas simbolis 1. Perkelkite žymeklį į simbolio įterpimo tašką. 2. Paspauskite mygtuką su reikiamu simboliu. Trūksta simbolio 1. Užveskite žymeklį už netinkamo simbolio. 2. Paspauskite mygtuką Atgal. erdvė. 3. Paspauskite klavišą su reikiamu simboliu. Neteisingas simbolis 1. Užveskite žymeklį prieš papildomą simbolį. 2. Paspauskite klavišą Delete.

      Raktiniai žodžiai:
      • tekstą
      • Tekstinis dokumentas
      • teksto redaktorius
      • teksto įvedimo taisyklės
      • redagavimas
      • formatavimas

Tekstas kaip informacijos pateikimo forma

Kiekvienas parašytas tekstas yra tam tikra simbolių seka. Bent vieno simbolio praleidimas, pakeitimas ar pertvarkymas tekste kartais pakeičia jo reikšmę. Apsvarstykite dvi frazes, kurios viena nuo kitos skiriasi vienu paskutiniu simboliu:

Kas atėjo pas mus!

Kas atėjo pas mus?

Pirmosios simbolių sekos reikšmė ta, kad įėjęs asmuo buvo matomas ir atpažintas. Antroji simbolių seka yra klausimas, pabrėžiantis situacijos neapibrėžtumą ir neapibrėžtumą.

Tūkstančius metų žmonės fiksavo informaciją. Per tą laiką daiktai, ant kurių buvo fiksuojama informacija (akmuo, molis, medis, papirusas, pergamentas, popierius) ir priemonės, kuriomis tai buvo padaryta (smailus akmuo, kaulinė lazda, paukščio plunksna, plunksnakočiai, plunksnakočiai , XIX amžiaus pabaigoje rašto darbams atlikti pradėta naudoti spausdinimo mašinėlė). Tačiau pagrindinis dalykas nepasikeitė: norint pakeisti tekstą, jį reikėjo perrašyti. Ir tai yra labai ilgas ir daug pastangų reikalaujantis procesas.

Kompiuterių atsiradimas iš esmės pakeitė rašymo technologiją. Naudodami specialias kompiuterines programas galite įvesti bet kokį tekstą, prireikus jį keisti, įrašyti tekstą į kompiuterio atmintį ilgalaikiam saugojimui, atspausdinti bet kokį teksto kopijų skaičių spausdintuve jo neįvedant iš naujo. , arba siųsti tekstą el. paštu į kitus kompiuterius.

Papildomos informacijos apie tekstinių dokumentų kūrimo istoriją rasite elektroniniame vadovėlio priede.

Tekstiniai dokumentai

Tekstinis dokumentas gali būti straipsnis, ataskaita, istorija, eilėraštis, kvietimas, pranešimas, atvirukas. Dirbant tinkle, vieno sudėtingo dokumento dalys gali būti saugomos skirtingi kompiuteriai esantys toli vienas nuo kito.

Hipertekstas – tai būdas sutvarkyti dokumentą, kad galėtumėte greitai rasti reikiamą informaciją. Jis dažnai naudojamas kuriant internetines pagalbos sistemas ir didelių žinynų bei enciklopedijų kompiuterines versijas. Perėjimas iš vienos hiperteksto vietos į kitą vyksta nuorodų pagalba. Pavyzdžiui, tarkime, kad skaitote gyvūnų enciklopediją ir jus ypač domina informacija apie šunis. Tarkime, kad žodis „buldogas“ yra pabrauktas – tai rodo nuorodą hipertekste. Jei spustelėsite šį žodį pele, pateksite į kitą enciklopedijos straipsnį, kuriame kalbama apie šią šunų veislę.

Pagrindiniai tekstinio dokumento objektai yra: simbolis, žodis, eilutė, pastraipa, puslapis, fragmentas.

Simbolis- skaičius, raidė, skyrybos ženklas ir kt.

Žodis- savavališka simbolių seka (raidės, skaičiai ir kt.), iš abiejų pusių apribota tarnybiniais simboliais (pvz., tarpas, kablelis, skliausteliai ir kt.).

Linija- savavališka simbolių seka tarp kairiosios ir dešiniosios dokumento kraštinės.

Pastraipa- savavališka simbolių seka, apribota specialiais simboliais pastraipos pabaigoje. Leidžiamos tuščios pastraipos.

Fragmentas- savavališka simbolių seka. Fragmentas gali būti vienas žodis, eilutė, pastraipa, puslapis ar net visas įvedamas tekstas.

Kompiuteris – pagrindinė tekstų rengimo priemonė

Teksto rengimas yra viena iš labiausiai paplitusių kompiuterių programų. Bet kuriame kompiuteryje yra specialios programos, skirtos tekstams kurti – teksto rengyklės.

Jūs jau dirbote su paprastu teksto redaktoriumi. Su juo galite kurti paprastus tekstus, sudarytus iš raidžių, skaičių, skyrybos ženklų ir specialieji simboliai, kurį galima įvesti naudojant klaviatūrą.

Kurti ir kurti istorijas, ataskaitas, mokyklos laikraščio straipsnius su užrašais, lentelėmis, diagramomis, brėžiniais, nuotraukomis, naudojami galingesni teksto redaktoriai. Jie taip pat vadinami tekstų rengyklėmis.

Vieno iš paprastų tekstų rengyklės langas parodytas fig. 24.

Ryžiai. 24

Dokumento rengimas kompiuteriu susideda iš tokių etapų kaip įvedimas (spausdinimas), redagavimas, formatavimas ir spausdinimas.

Teksto įvedimas

Teksto įvedimas (įvedimas) paprastai atliekamas naudojant klaviatūrą. Kito teksto simbolio įvedimo vieta rodoma monitoriaus ekrane, naudojant mirksėjimą vertikali juosta- žymeklis.

Įvesdami tekstą laikykitės šių taisyklių:

  1. Jei reikia, naudokite didžiąsias raides.
  2. Visi skyrybos ženklai, išskyrus brūkšnį, turi būti dedami iškart po paskutinės žodžio raidės; Po bet kurio skyrybos ženklo paspauskite tarpo klavišą. Abiejose pusėse pabrėžkite brūkšnelius su tarpais.
  3. Venkite įvesti dviejų ar daugiau tarpų iš eilės; nenaudokite tarpo pastraipų riboms lygiuoti.
  4. Nežiūrėkite eilutės pabaigos: kai tik ji bus pasiekta, žymeklis automatiškai pereis į kitos eilutės pradžią.
  5. Norėdami įvesti naują pastraipą (arba eilėraščio eilutę), paspauskite klavišą Enter.

Jei nustatysite nespausdinamų simbolių rodymo režimą, bus daug lengviau kontroliuoti, kaip laikomasi spausdinimo taisyklių.

Teksto redagavimas

Redagavimas yra kitas žingsnis ruošiant dokumentą kompiuteryje. Redaguodami tekstą peržiūrite jį, kad įsitikintumėte, ar viskas teisinga, ištaisote visas rastas klaidas (pvz., rašybos) ir atliekate reikiamus pakeitimus.

Jei tekstas yra didelis, tada ekrane bus matoma tik dalis jo, o visa tai bus saugoma kompiuterio atmintyje.

Naudojant žymeklio rodykles, žymeklį galima perkelti visame ekrane, perkeliant jį į bet kurį simbolį. Norėdami judėti visame dokumente, naudojami specialūs klavišai arba klavišų kombinacijos:

Be to, yra slinkimo režimas, leidžiantis greitai parodyti teksto dalis, kurios yra už jo ribų.

Redaguodami galite dirbti ne tik su atskirais simboliais, bet ir su visais teksto fragmentais. Pirmiausia reikia pasirinkti fragmentą. Norėdami tai padaryti, užveskite pelės žymeklį į norimo fragmento pradžią ir, laikydami nuspaudę pelės mygtuką, vilkite žymeklį iki galo.

Fragmento pasirinkimą galima atšaukti spustelėjus bet kurią lango darbo srities vietą.

Pasirinktą fragmentą galima pašalinti iš teksto ir ištrinti iš atminties arba jį galima pašalinti iš teksto, bet įdėti į specialią atminties skyrių, vadinamą buferiu. Tokiu atveju ištrintą fragmentą galima arba grąžinti į pradinę vietą, arba įdėti į kitą, tinkamesnę teksto vietą (25 pav.).

Ryžiai. 25

Kartais tenka įvesti tekstus, kuriuose ne kartą kartojasi atskiros eilutės ar net eilučių grupės (prisiminkime S. Maršako eilėraštį „Bagažas“ ar kokią dainą su refrenu). Pasikartojantis fragmentas įvedamas tik vieną kartą, tada jis parenkamas ir nukopijuojamas specialiu mygtuku – pats fragmentas lieka pradinėje vietoje, o tiksli jo kopija įdedama į buferį. Po to tęsiate rašymą ir, pasiekę vietą, kur turėtų būti pasikartojantis fragmentas, įklijuokite jį iš buferio. Šią procedūrą galima pakartoti daug kartų.

Teksto rengyklės leidžia rasti tekste nurodytą žodį, prireikus automatiškai pakeisti vieną žodį kitu visame tekste.

Šiuolaikiniams tekstų rengyklėms taip pat gali būti pavesta aptikti ir taisyti rašybos klaidas.

Teksto formatavimas

Formatavimo etape atliekamos įvairios dokumento formatavimo operacijos.

Pirma, teksto pastraipos yra sulygiuotos.

Kai tekstas sulygiuotas kairėje, pastraipos kairioji kraštinė sudaro tiesią liniją. Šiuo atveju visos eilutės turi vienodas įtraukas nuo puslapio krašto. Ši pastraipa sulygiuota į kairę.

Kai tekstas lygiuojamas dešinėje, dešinėje pastraipos kraštinėje susidaro tiesi linija. Kiekviena pastraipos eilutė baigiasi tokiu pačiu atstumu nuo puslapio krašto. Ši pastraipa sulygiuota dešinėje pusėje.

Sulygiuotas centre arba centre tekstas išdėstomas taip: abiejose kiekvienos eilutės pusėse laisvos vietos plotis yra vienodas. Abiejose pusėse pastraipos kraštai yra nelygūs. Ši pastraipa sulygiuota centre.

Daugelis teksto redaktorių „gali“ automatiškai skaidyti tekstą į puslapius ir juos sunumeruoti. Jie gali stebėti paraščių dydį ir reguliuoti tarpus tarp eilučių, pasiūlyti įvairių šriftų parinkčių pasirinkimą.

Šriftas yra visas abėcėlės raidžių rinkinys, turintis bendrą jų vaizdavimo stilių.

Įprastas šriftas neišsiskiria.

  • Paryškintas šriftas yra tamsesnis ir geriau matomas.
  • Kursyvas šriftas pasviręs.
  • Pabrauktas šriftas.

Šrifto dydis arba taško dydis yra šrifto aukštis, matuojamas nuo mažiausios raidės apatinio krašto (pvz., "p" arba "y") iki aukščiausios raidės viršutinio krašto (pvz., "b"). . Šrifto dydis matuojamas taškais. Vienas taškas yra labai mažas vienetas, lygus 1/72 colio 1 (0,3 mm), t. y. 72 taškų šriftas yra 1 colio aukščio. Daugumoje knygų dažniausiai naudojamas 10–12 taškų šriftas.

    1 colis yra ilgio vienetas anglų matų sistemoje, lygus 2,54 cm.

Papildomą informaciją apie šriftus rasite elektroniniame vadovėlio priede.

Norėdami spausdinti dokumentą ant popieriaus, prie kompiuterio prijungiamas spausdintuvas. Egzistuoti skirtingi tipai spausdintuvai.

Taškinis spausdintuvas spausdina metalinėmis adatomis, kurios prispaudžia rašalo juostelę prie popieriaus. Pataikę į juostą, jie palieka popieriuje taškų raštą – raidės matricą.

Rašalinis spausdintuvas spausdina raides ant popieriaus, purškdamas ant jo skysto rašalo lašelius.

AT Lazerinis spausdintuvas naudojamas simboliams spausdinti lazerio spindulys. Tai leidžia gauti tipografinio spausdinimo kokybę.

Svarbi informacija apie tekstinių dokumentų kūrimą kompiuteryje pateikiama vaizdo paskaitoje „Darbo su tekstu technikos“, paskelbtoje Unified Collection of Digital švietimo ištekliai(sc.edu.ru).

Svarbiausias

Tekstas yra bet koks žodinis pareiškimas, atspausdintas, rašytinis arba esantis žodžiu.

Informacija, pateikiama rašytinio teksto forma, vadinama tekstine informacija.

Tekstinei informacijai apdoroti skirtos specialios programos – teksto rengyklės.

Bet koks tekstas, sukurtas naudojant teksto rengyklę, kartu su jame esančia netekstine medžiaga vadinamas dokumentu.

Dokumento rengimas kompiuteriu susideda iš tokių etapų kaip įvedimas (spausdinimas), redagavimas ir formatavimas.

Klausimai ir užduotys

  1. Papasakokite apie tekstinę informacijos pateikimo formą. Kokias kitas informacijos pateikimo formas žinote? Papasakokite apie informacijos pateikimo teksto privalumus arba trūkumus, palyginti su jūsų aprašyta forma.
  2. Kokiu tikslu kuriate tekstus? Pateikite du ar tris pavyzdžius.
  3. Pateikite tekstų, kurie skiriasi dydžiu, dizainu ir paskirtimi, pavyzdžius.
  4. Kokius esminius pakeitimus kompiuteris padarė teksto kūrimo procese?
  5. Kaip suprantate posakio: „Kas parašyta tušinuku, to negalima nukirsti kirviu“ prasmę? Ar sutinkate su tuo?
  6. Kas yra bendra ir kuo skiriasi galimybės tekstų rengyklė ir teksto redaktorius?
  7. Ką jūs suprantate iš teksto dokumento?
  8. Išvardykite pagrindinius tekstinio dokumento rengimo kompiuteriu etapus.
  9. Kokių taisyklių reikia laikytis renkant (rašant) tekstą?
  10. Kaip tekstas gali būti transformuojamas jo redagavimo etape?
  11. Kokius „perkėlimo“ per didelį tekstinį dokumentą metodus žinote?
  12. Kodėl reikia formatuoti tekstą? Kaip šiame etape tekstas gali būti paverstas?
  13. Koks yra įrenginio, skirto dokumentui išvesti į popierių, pavadinimas?
  14. Kuris teksto kūrimo būdas – kompiuteris ar ranka – tau patinka labiau? Pagrįskite savo pasirinkimą.
  15. Viena iš žodžio „redaktorius“ reikšmių yra asmuo, kuris autoriaus sutikimu taiso rankraštį. Pabandykite pasinaudoti šia informacija, kad paaiškintumėte, kodėl tekstų kūrimo kompiuterinės programos vadinamos teksto rengyklėmis.

Kompiuterių dirbtuvės

5 darbas "Įveskite tekstą"
6 darbas "Teksto redagavimas"
7 darbas "Dirbame su teksto fragmentais"
8 darbas „Teksto formatavimas“