База знаний:
Работа с форматом файлов .CSV
Автор Александр Панько, Last modified by Александр Ницуляк на 19 July 2016 02:40 PM

Текстовый формат CSV (от англ. Comma-Separated Values — значения, разделённые запятыми) — формат, предназначенный для представления табличных данных. Каждая строка файла — это одна строка таблицы. Значения отдельных колонок разделяются следующими символами: запятой (,), точкой с запятой (;), двоеточием(:).

На сегодняшний день, под CSV, как правило, понимают набор значений, разделенных какими угодно разделителями, в какой угодно кодировке с какими угодно окончаниями строк.

Пример строки из файла формата .CSV:

 

Иван;Иванов;ivanov-ivan@gmail.com;1978;м;Москва

 

Давайте разберем эту запись. Итак, мы видим порядок данных, которые разделены точкой с запятой. Не трудно догадаться, что данные у нас в следующем порядке: имя, фамилия, email-адрес, год рождения, пол и соответственно город, в котором проживает наш подписчик. Обратите внимание, что абсолютно каждое значение разделено общепринятым разделителем, то есть точкой с запятой. Для чего это делается?

Если вы попытаетесь скопировать эту запись в стандартную программу Microsoft Windows «Блокнот» («Notepad»), и сохранить этот документ в формате .CSV, то, впоследствии Вы обнаружите, что открыв документ с помощью Excel, каждая запись будет в отдельной ячейке. Microsoft Excel видит данный файл как таблицу, а разделитель обозначает ячейку, в которой находится запись. Именно по данной причине НИ В КОЕМ случае не стоит «смешивать» данные, то есть записывать имя и фамилию без разделителя, иначе система поймет, что эти данные находятся в одной ячейке, и соответственно они будут записаны в одно и то же поле при загрузке.

Иногда данные каждой ячейки также берутся в кавычки, их стоит использовать, когда в данных присутствуют пробелы, пример:

 

"Иван Иванович";"Иванов";"ivanov-ivan@gmail.com";"25.02.1978";"m";"Москва"

 

Обратите внимание, что в кавычки были взяты абсолютно все данные, то есть, если вы используете кавычки, то их ОБЯЗАТЕЛЬНО необходимо использовать уже для каждой ячейки.

Также хотелось бы отметить важный момент, к примеру, у вас все строки файла состоят из следующих значений:

 

Имя;Фамилия;email-адрес

 

Но, что делать, если у некоторых пользователей не указана фамилия? В данном случае вам лишь необходимо оставить вместо значения разделитель, то есть ячейка указывается, но она будет пустой, пример:

 

Имя;Фамилия;email-адрес

Имя;Фамилия;email-адрес

Имя;;email-адрес

Имя;Фамилия;email-адрес

 

Как работать с данным форматом?

 

На самом деле ничего проще быть не может, .CSV-файл можно создать из стандартной программы Microsoft Windows «Блокнот» («Notepad»), записав в нем данные на отдельный строках, через разделитель и сохранив его как: “документ.CSV”. Впоследствии для редактирования файла вы также можете использовать текстовый редактор – «Notepad++», «Блокнот», или же такие профессиональные инструменты, как: MicrosoftExcel, OpenOffice.orgCalc.

Мы рекомендуем вам использовать именно OpenOffice.orgCalc, так как он крайне прост и удобен в работе, более того, в нем легко можно изменить или же выбрать необходимую кодировку для ваших данных, в том случае, если данные написанные на русском распознаются некорректно.

Пример работы с .CSV-файлом в программе OpenOfficeCalc: 

Для того, чтобы открыть .CSV-файл в программе OpenOfficeCalc, воспользуйтесь меню: «Файл -> Открыть» и в открывшемся диалоговом окне выберите ваш .CSV-файл на ПК. После того, как вы внесете изменения, воспользуйтесь пунктом меню «Файл -> Сохранить», чтобы изменения вступили в силу.

Для того, чтобы создать .CSV-файл в OpenOfficeCalc, запишите необходимые данные в каждую ячейку и воспользуйтесь пунктом меню «Файл -> Сохранить как».

В открывшемся диалоговом окне введите имя файла и тип «Текст CSV (.csv)». При этом обязательно отметьте чекбокс «Изменения настроек фильтра», это необходимо для того, чтобы при сохранении задать кодировку файла. После клика на клавишу «Сохранить (Save)» будет открыто еще одно окно «Экспорт текста», именно в нем вам обязательно необходимо будет указать кодировку «Кириллица (Windows-1251)».

Мы рекомендую вам использоваться именно OpenOfficeCalc так как исключительно данная программа позволяет легко задать корректную кодировку непосредственно при сохранении ваших данных.

(62 голос(а))
Эта статья полезна
Эта статья бесполезна

Комментарии (9)
Пантилемон. Обломов.
26 March 2014 07:11 AM
Полезные моменты,уяснил.Благодарю.
Сергей Борисов
12 September 2014 04:13 AM
спрасибо, отл статья
Alexis
11 February 2015 07:42 PM
За статью огромная благодарность, все по делу.
Маша
12 February 2015 04:37 PM
Сайт хорош, слов нет.
руслан
25 February 2015 07:38 PM
И мне понравилось, спасибо.
Владимир
15 July 2015 10:13 PM
Быстро и коротко. Некоторые "писатели" написали бы целую книгу. Спасибо, думаю точно пригодится.
LM
21 April 2016 06:59 AM
Спасибо за статью!
А есть ли другие инструменты по работе с CSV?
Например, Эксель в этом формате позволяет себе вольности, например, текст "2/10" сам преобразовывает в текст "2 октября" при сохранении, без возможности оставить как есть (даже если выставить формат ячейки "текст"); несколько нулей подряд в одном поле просто сокращает до одного ноля, и прочее. Файл коверкается при сохранении, и может быть использован дальше только после последующего редактирования в Блокноте. OpenOfficeCalc не пробовал, кто может сказать - там всё так же плохо?
Максим Чумер
25 April 2016 12:19 PM
Здравствуйте!

Наша система позволяет загружать списки и в формате xls. Поэтому Вы можете использовать файлы MS Excel сохраненные в версии до 2003 года!

Всего доброго!
Виктор
28 April 2016 01:38 PM
Как должен выглядеть файл при импорте - https://youtu.be/4Hby4fwCCFA?t=2m39s
Добавить новый комментарий
 
 
Полное имя:
Email:
Комментарии: