À DataMarket, par exemple, vous pouvez rechercher des datasets, rassembler les données, télécharger vos propres données et les comparer. Vous pouvez également produire les résultats à l'aide des modèles de graphiques et de visualisation de DataMarket.
Amazon offre des ensembles de données publics sur AWS, qui fournit un référentiel centralisé d'ensembles de données publiques gratuits qui peuvent être intégrés dans des applications Cloud AWS. Google a l' Explorateur de données public, manyeyes d'IBM est orienté vers la visualisation.
Les faits se concentrent sur les lieux et les produits. Vous pouvez mash-up de vos informations avec leurs données sur les entreprises locales, points d'intérêt, restaurants, Hôtels, et les biens de consommation emballés.
Infochimps a de nombreux jeux de données gratuits, y compris le texte brut de 4 771 histoires érotisme, 100000 + mots croisés officiels, et les taux de naissance et de décès des adolescents américains, abattus à partir du recensement des États-Unis.
Microsoft Windows Azure Data Marketplace, comme son nom l'indique, intègre des données avec ses applications. Ses actifs de données comprennent des indicateurs économiques, des numéros de téléphone, des données météorologiques, ainsi que des datasets régionaux comme les statistiques de la criminalité pour l'Angleterre et le pays de Galles.
Il y a des avantages à acheter des données de ces marchés. Pour une chose, c'est propre, qui peut être un changement bienvenu à partir des données salissantes que vous avez essayé de frotter. Beaucoup de services vous permettent également de faire vos données de craquage sur leurs serveurs, vous libérant des téléchargements de temps et souvent compliqué. Si vous utilisez déjà une solution d'analyse de données basée sur un nuage de l'un des fournisseurs, le processus est encore plus facile.
Et vous pouvez être surpris par la variété de données qui est disponible.
«la grande disponibilité des données continue à me surprendre chaque jour», a déclaré Shawndra Hill, qui travaille avec et enseigne sur les grandes données dans le département des opérations et de la gestion de l'information à la Wharton School de l'Université de Pennsylvanie.
«mes collègues et moi avons utilisé des données accessibles au public pour prédire la sécheresse en Ethiopie, le succès des émissions de télévision, ce que les gens suivront sur Twitter, le succès de la publicité, et les tendances boursières», a déclaré m. Hill. «Nous avons également travaillé à relier les drogues à leurs effets secondaires. Dans le passé, ces projets ne seraient pas possibles sans des partenariats avec des entreprises qui permettaient l'utilisation de leurs données propriétaires.
Note de l'éditeur: il s'agit du quatrième poste de la série en cours "êtes-vous prêt pour Big Data?" par DC Denison. Téléchargez l' ebook complet "êtes-vous prêt pour Big Data" pour en savoir plus sur Big Data, ses applications dans la création de la prochaine expérience numérique génération, et ce qu'il faut pour entrer dans le jeu.