In diesem Projekt wurden Preise für Taxifahren in New York vorhergesagt. Es hat sich gezeigt, dass Machine Learning für diese Art der Problemstellung gut geeignet ist. Der Datensatz wurde, um kürzere Rechenzeiten zu haben, von 55 Millionen Observationen auf 5 Millionen Observationen verkleinert. Danach wurde er bereinigt und erforscht. Ein neues Feature, das sich als der beste Prädiktor herausstellte, wurde erschaffen, die relative Strecke, die gefahren wurde. Dann wurden zwei Algorithmen, Linear Regression und Random Forest Regressor, auf dem Datensatz trainiert und getestet.