Усещам, че ще има още много публикации с лайтмотив "нашите кацнаха на Луната", защото като онези мишки продължавам да владея кактуса. И въпреки че кактусът изглежда като ябълка и мирише на ябълка, а всъщност е ябълка, той хвърля толкова много бодли, че не можете да го преглътнете в Google. Фигурнов публикувал ли е нещо за Mac там? Имам остро дежавю от първото запознанство с Windows.

Днес срещнах руски имена на файлове, в пълен растеж, стар проблем, но не бях седял толкова плътно на Apple Mac преди.

Въпросът е. Някой изпраща архив от компютър, вътре в руските имена на файлове или папки, изтегляте го в Safari и получавате това:

Първата част от проблема е, че обикновеният архиватор разбира руски имена на файлове или не винаги, или никога. Трябва да го променим. Винаги съм инсталирал WinRAR на Windows, това беше една от първите стъпки след инсталацията и тогава реших да се спра на безплатния The Unarchiver, той се интегрира в системата и разопакова всичко правилно.

Втората част от проблема е, че Safari след изтегляне винаги разопакова самия архив с обикновен архиватор, така че не разбира нищо. Лекува се с влизане в настройките на Safari и премахване на отметката „open безопасни файловеслед зареждане" (най-долу):

Инсталирането на The Unarchiver не решава проблема, защото той става "обикновен инструмент за отваряне" за ZIP само във Finder, а за Safari този Finder изобщо не е авторитет.

Въпрос:Има ли архиватор, който побеждава този бъг?

И така, всичко е интуитивно ясно, за домакини, домакини, но само тези с Google в главите си. Чувствам, че трябва по някакъв начин да се принудя, в съответствие с предписанията, да спра да го използвам по този начин, но нямам идея как да го направя.

P.S. Е, за да не ставам два пъти, нека ви напомня, че разопаковам архивите на iPhone / iPad

Открих, че кодирането на WINDOWS-1252 е най-малко разочароващо при работа с Excel. Тъй като има собствен набор от знаци, базиран на Microsoft, може да се предположи, че ще работи както на Mac, така и на Windows версии на MS-Excel. И двете версии поне включват подходящ селектор „Произход на файл“ или „Кодиране на файл“, който правилно чете данните.

В зависимост от вашата система и инструментите, които използвате, това кодиране може също да бъде наречено CP1252, ANSI, Windows (ANSI), MS-ANSI или просто Windows сред други опции.

Това кодиране е надмножество на ISO-8859-1 (известен още като LATIN1 и други), така че можете да се върнете към ISO-8859-1, ако по някаква причина не можете да използвате WINDOWS-1252. Имайте предвид, че в ISO-8859-1 липсват някои знаци от WINDOWS-1252, както е показано по-долу:

| Char | ANSI | Уникод | ANSI Hex | Уникод шестнадесетичен | HTML обект | Unicode име | Уникод диапазон | | € | 128 | 8364 | 0x80 | U+20AC | € | евро знаци | Валутни символи | | ‚ | 130 | 8218 | 0x82 | U+201A | ‚ | единична ниска 9 кавичка | Обща пунктуация | | ƒ | 131 | 402 | 0x83 | U+0192 | ƒ | латинска малка буква f с кука | латиница Extended-B | | „ | 132 | 8222 | 0x84 | U+201E | „ | двойна ниска 9 кавичка | Обща пунктуация | | … | 133 | 8230 | 0x85 | U+2026 | … | хоризонтална елипса | Обща пунктуация | | † | 134 | 8224 | 0x86 | U+2020 | † | кама | Обща пунктуация | | ‡ | 135 | 8225 | 0x87 | U+2021 | ‡ | двоен кинжал | Обща пунктуация | | ˆ | 136 | 710 | 0x88 | U+02C6 | ˆ | модификатор буква циркумфлекс ударение | Букви модификатори на разстояние | | ‰ | 137 | 8240 | 0x89 | U+2030 | ‰ | знак за промили | Обща пунктуация | | Š | 138 | 352 | 0x8A | U+0160 | Š | Главна латинска буква S с карон | Latin Extended-A | | ‹ | 139 | 8249 | 0x8B | U+2039 | ‹ | единична сочеща наляво ъглова кавичка | Обща пунктуация | | Œ | 140 | 338 | 0x8c | U+0152 | Œ | Латинска главна лигатура OE | Latin Extended-A | | Z | 142 | 381 | 0x8E | U+017D | | Главна латинска буква Z с карон | Latin Extended-A | | „| 145 | 8216 | 0x91 | U+2018 | „| лява единична кавичка | Обща пунктуация | | ' | 146 | 8217 | 0x92 | U+2019 | ' | дясна единична кавичка | Обща пунктуация | | " | 147 | 8220 | 0x93 | U+201C | “ | лява двойна кавичка | Общи пунктуационни знаци | | " | 148 | 8221 | 0x94 | U+201D | ” | дясна двойна кавичка | Обща пунктуация | | | 149 | 8226 | 0x95 | U+2022 | . | куршум | Обща пунктуация | | – | 150 | 8211 | 0x96 | U+2013 | - | en dash | Обща пунктуация | | - | 151 | 8212 | 0x97 | U+2014 | — | тире | Обща пунктуация | | ˜ | 152 | 732 | 0x98 | U+02DC | ˜ | малка тилда | Букви модификатори на разстояние | | ™ | 153 | 8482 | 0x99 | U+2122 | ™ | знак за търговска марка | Буквоподобни символи | | s | 154 | 353 | 0x9A | U+0161 | s | Малки латински букви с карон | Latin Extended-A | | › | 155 | 8250 | 0x9b | U+203A | › | единична сочеща надясно ъглова кавичка | Обща пунктуация | | - | 156 | 339 | 0x9C | U+0153 | - | латинска малка лигатура oe | Latin Extended-A | | ž | 158 | 382 | 0x9E | U+017E | | латинска малка буква z с карон | Latin Extended-A | | Ÿ | 159 | 376 | 0x9F | U+0178 | Ÿ | Главна латинска буква Y с диереза ​​| Latin Extended-A |

Моля, имайте предвид, че знакът евро липсва. Тази таблица може да се намери в Alan Wood.

Преобразуване

Преобразуването се извършва по различен начин за всеки инструмент и език. Да предположим обаче, че имате файл query_result.csv, за който знаете, че е UTF-8 кодиран. Конвертирайте го в WINDOWS-1252 с iconv:

Iconv -f UTF-8 -t WINDOWS-1252 query_result.csv > query_result-win.csv

Най-вероятно много потребители на Mac трябваше да работят с txt файлове. Най-често в този формат се представят различни ръководства, readme, инструкции и др. И ако тези документи са създадени в Windows среда, тогава когато ги отворите на Mac, може да има малък, но в същото време изключително неприятен проблем с кодирането.

Нека да разберем заедно как да научим Mac да разпознава 100%. txt файлсъздаден на Windows.

Факт е, че Операционна система Apple и Microsoft се ръководят от различни стандарти при кодирането на кирилицата, оттам и проблемите с нейното изобразяване. Съществуват специални помощни програмипредназначен да направи кодирането на Windows приятели с Mac OS X, но предлагам да се справите със стандартни инструменти.

Решение

Оригиналното кодиране на Mac трябва да се промени на Windows кирилица. За да направите това, намерете скрития файл в началната папка .CFUsertextEncoding.

За показване скрити файловетрябва да отидете на Терминал(програми > помощни програми) и въведете командата (можете да я копирате).

По подразбиране пише com.apple.finder AppleShowAllFiles -bool true

Killall Finder

и отново влизам.
За да направите файловете отново скрити, трябва да замените в първата команда вярнона невярнои след това рестартирайте Finder отново.

И така, щракнете върху този файл Кликнете с десния бутони в подраздела "отвори в програмата" изберете TextEdit. Има само един ред в документа, който се нуждае от стойност 0x7заменен от 0x502. След това запазете файла, рестартирайте вашия Mac и се наслаждавайте.

Ако статията е помогнала, не бъдете мързеливи. Щракнете върху бутона, за да споделите!

Вграден цип Mac клиент OS X, с логичното и неусложнено име Mail, има какво да похвали - например за усъвършенствана система за филтриране на съобщения, базирана на правила, за поддръжка на допълнителни плъгини, които разширяват възможностите за поща (като криптиране), за тясна интеграция с iPhone клиент и др. Но потребителите на Mail също имат какво да се оплакват, особено ако не живеят в англоговорящи страни. Главната причина - кодиране. Може би няма нито един руски собственик на мака, който да не е срещал Mail.App с това, което обикновено се нарича думата „кракнат“ - това са символични шедьоври като èõþþþðððø Theseïúðә, aaiba -aakaab € €º °Ñ Ñлект рРв заглавия на теми, съдържание на имейли или имена на прикачени файлове.

Днес ще ви разкажем за същността на този проблем и някои начини за решаването му.

Mail.app традиционно се отличава от другите имейл клиенти с повишената си чувствителност към от коя програма е изпратен имейла. Въпросът е, че е различен пощенски клиентиимат свои собствени функции за маркиране и дизайн на имейли, невидими за окото на потребителя, но възприемани от сървъри и програми.

Проблемът се утежнява от факта, че в настройките на Mail не може да зададе кодиране по подразбиране за входящи имейли— т.е. начин за превод на букви, цифри и препинателни знаци, познати ни в битове и байтове, познати на компютъра. Пощата се опитва автоматично да разпознае кодирането на входящата поща и потребителят също не може директно да повлияе на този процес.

Но е възможно да се повлияе на този процес индиректно. Наборът от кодировки, които Mail използва за разпознаване, зависи от набора от използвани кодировки. цялата система за кодиране. Този набор от своя страна зависи от броя на езиците, използвани от системата. Оттук следва Първият съвет е да премахнете всички езици, които не използвате от системата.

Отидете на Системни настройки , изберете дистанционно „Език и текст“и ще видите следния списък:

Кликнете върху бутона „Редактиране на списък“и премахнете отметките от съответните квадратчета. След това рестартирайте компютъра си или прекратете сесията си.

Показаната екранна снимка е направена Mac система OS X 10.6.2. В Mac OS X 10.5 този панел с настройки е подреден малко по-различно, но редактирането на списъка с езици е организирано почти по същия начин там.

Следващата стъпка е да конфигурирате самия Mail клиент. Както вече казахме, програмата не предоставя постоянни настройки за кодиране. Но това не означава, че те изобщо не съществуват. Всъщност, през терминала все още можете да принудите Mail да работи с определено кодиране.

Но преди да зададете кодирането по подразбиране, трябва да знаете какво трябва да бъде кодирането. Това ще трябва да се направи експериментално:

  1. намери някои букви с krakozyabry
  2. изберете първия и отидете в менюто Съобщение - Кодиране на текст
  3. последователно опитайте всички кодировки, започващи с думата "кирилица"(KOI8-R, ISO 8859-5, Windows) и UTF-8
  4. ако писмото е станало четимо, погледнете останалите букви: ако те могат да бъдат прочетени, считайте, че решението е намерено
  5. в противен случай продължете да итерирате над кодировките

Ако сте намерили подходящо кодиране, остава да го коригирате. Най-вероятно или ще бъде кодиране KOI8-R или UTF-8. Попълнете изцяло пощата (чрез комбинация cmd+q). Бягай Терминал(чрез Spotlight или от папка Програми/Помощни програми), и въведете командата:

по подразбиране пише com.apple.mail NSPreferredMailCharset koi8-r

по подразбиране пише com.apple.mail NSPreferredMailCharset utf-8

След това натиснете Enter и затворете терминала.

Ако не искате да се забърквате с терминала, можете да инсталирате и промените кодирането чрез него:


Ако предложената по-горе опция не работи, опитайте да регистрирате още един параметър през терминала:

по подразбиране пише com.apple.mail LeopardPreferredMailCharset utf-8

(или по подразбиране пише com.apple.mail LeopardPreferredMailCharset koi8-r)

Може би това ще ви помогне да се отървете от проблемите с кодирането в темата и тялото на имейлите. ОТ Руски имена на прикачени файловеситуацията е още по-мистериозна. Дългосрочните наблюдения ни позволяват да кажем, че не Mail е виновен за щетите им, а програмата, която изпраща пощата. Например, известен проблем с писма от Thunderbird- почти винаги имената на прикачените файлове на руски идват на Mac повредени. За да разрешите този проблем в самия Thunderbird, трябва да промените стойността на параметъра mail.strictly_mime.parm_foldingравно на едно.

Следователно причините и решенията на проблемите в Mail са много по-дълбоки, отколкото изглежда на пръв поглед. Ако всичко друго се провали и писмата, адресирани до вас, все още ще пристигнат повредени, съветваме ви да обърнете внимание на други имейл клиенти.