Проект модели такси
Автор: fuksanzhelika • Май 26, 2022 • Реферат • 757 Слов (4 Страниц) • 212 Просмотры
Введение:
В 1915 году Шоу и Герц создали компанию Yellow Cab Manufacturing, чтобы произвести собственную модель такси. Так была создана Model J.
Они переоборудовали около 40 автомобилей, которые отправились по улицам Чикаго. К 1925 году в таксопарке Yellow Cab Company было 2700 автомобилей.
Придумали красить такси в жёлтый
Особый цвет такси был выбран не случайно. Герц пришел к этой идее, прочитав исследование университета Чикаго, где описывалось, что желтый цвет — наиболее заметный глазу с большой дистанции.
Выбор единого стиля автомобилей позволил клиентам отличать официальные таксопарки от индивидуальных водителей.
[pic 1]
Обращаем внимание на Context, Content, Inspiration, переводим.
Из этих текстов извлекаем:
Context : Этот набор данных включает в себя поездки на такси за 2016 год, о которых сообщается городу Чикаго в его роли регулирующего органа. Чтобы защитить конфиденциальность, но обеспечить совокупный анализ, идентификатор такси соответствует любому заданному номеру медальона такси, но не показывает номер, переписные участки в некоторых случаях скрыты, а время округляется до ближайших 15 минут. Из-за процесса предоставления данных не обо всех поездках сообщается, но городские власти считают, что большинство. См. http://digital.cityofchicago.org/index.php/chicago-taxi-data-released для получения дополнительной информации об этом наборе данных и о том, как он был создан.
Content: Подробную информацию о конкретных полях см. в словаре данных. Мы также сократили исходные файлы примерно на две трети, удалив лишние столбцы и переназначив несколько других для использования более коротких идентификаторов. Например, столбец taxi_id раньше представлял собой строку из 128 символов. Мы заменили его целым числом, содержащим не более четырех цифр.
Излишними столбцами были уникальный ключ, место получения и место высадки. Переназначенные столбцы: идентификатор такси, компания, переписной участок посадки, переписной участок высадки, широта посадки, долгота посадки, широта высадки и долгота высадки. Исходные версии этих столбцов можно распаковать с помощью файла column_remapping.json.
Inspiration: Насколько централизован Чикаго? Другими словами, какая часть поездок приходится на центр города или обратно? В Чикаго разветвленная система метро. Такси конкурируют с поездами, проезжая по схожим маршрутам, или дополняют общественный транспорт, доставляя людей на вокзалы и обратно?
[pic 2]
Ознакомимся со словарем данных для получения подробной информации о конкретных полях. Также сократили исходные файлы, удалив избыточные столбцы и переназначив несколько других, чтобы использовать более короткие идентификаторы.
Сократив количество индикаторов до 100, чтобы нам было удобнее провести расчёты.
Таким образом выходит таблица со столбцами:
taxi_id | Идентификатор такси |
trip_start_timestamp | отметка времени начала поездки |
trip_end_timestamp | отметка времени окончания поездки |
trip_seconds | Секунды поездки |
trip_miles | Поездка в милях |
dropoff_census_trac | Когда закончилась переписка |
pickup_community_ | Когда подобрали пассажира |
dropoff_community | Высадка пассажира |
fare | Плата за проезд |
Поставим вопросы к Датасету:
1. Какая самая большая оплата и за сколько миль?
[pic 3]
Копируем столбец с милями и оплатой Далее с помощью команды “СЧЁТЕСЛИ” считаем количество каждого. После чего сравниваем результаты и выделяем самое большое количество.
Ответ: Плата 90.00 за 0 миль
2. Сколько поездок совершило такси с идентификатором 2803?
[pic 4]
Копируем Столбец с данным с определённым такси.
Далее с помощью команды “СЧЁТЕСЛИ” отсчитываем количествопоездок. Выводим ответ: 254.
Вывод
Проделав данную работу, мы познакомились с предоставленным нам датасетом и выделили несколько интересных фактов о Чикагское такси. Например,
...