Extraction de données techniques - Sélection des attributs importants


Alors vous pourriez penser maintenant que nous sommes tous des méthodes de sélection extraction de données d'attributs?

Oui, il existe plusieurs techniques, en fonction des types de modélisation que vous faites.




En général, on peut suivre les étapes suivantes comme indiqué dans l'ordre.

1) Réduire les variables en pourcentage manquant.

2) Réduire les variables qui ont une forte VIF (contrôle multicollinerity)

3) Si certains Xs sont fortement corrélés avec Ys, les libérer au début de la modélisation.

4) Réduire les variables selon valeur informative.

5) Réduire les variables deuxième signification Tenir la valeur P <0,0001.

6) A les variables significatives, afin de réduire les variables avec une faible | t | ou basse carrés Chi.

7) Supprimez les variables dont les signes sont «persistant», ce est à dire, ne signez pas la même lorsqu'il est introduit modéliser individuellement que lorsque vous êtes mis ensemble dans un modèle. Dans les deux scénarios, signe/valeur des estimations des paramètres devrait être la même, même si la valeur estimée sera différent.

8) Si vous avez encore des variables «plus», alors vous pouvez essayer d'utiliser l'analyse factorielle pour réduire le nombre de variables et, à la place de ceux, utiliser des combinaisons de lignes régulières de ces variables, ce est en utilisant le facteur.

9) Enfin, pour réduire les variables qui ne ont pas le sens des affaires.

L'exploration de données est important pour votre entreprise et vous devez savoir les attibutes correctement

Data Mining - une courte introduction vidéo professeurs

techniques d'exploration de données, des exemples, des exemples et des ressources

  • le renforcement du modèle d'exploration de données avec attribut important - - US Patent 7219099
    le renforcement du modèle d'exploration de données avec attribut important - US Patent 7219099 par PatentStorm. Un programme système de produit, méthode, et l'ordinateur qui utilise attacher de l'importance (AI) de réduire le temps et les ressources informatiques nécessaires à la construction de l'exploitation minière
  • le renforcement du modèle d'exploration de données avec attribut important - Brevet 7219099
    Un programme système de produit, méthode, et l'ordinateur qui utilise attacher de l'importance (AI) de réduire les temps et les ressources informatiques nécessaires à la construction des modèles d'exploration, et qui fournit un correspondant
  • http://www.oracle.com/technology/products/bi/odm/pdf/crime_patterns_snath_odm.pdf
  • http://www.ncdm.uic.edu/workshops/dm-ssp04/composing_data_mining_operations.pdf
  • http://books.google.co.in/books?hl=en&id=SNDfRPYomLYC&dq=data+mining&printsec=frontcover
  • Data Mining: Qu'est-ce que l'exploration de données?
  • Mines - Wikipedia, l'encyclopédie libre
  • http://books.google.co.in/books?hl=en&id=QTnOcZJzlUoC&dq=data+mining&printsec=frontcover
  • Algorithmes d'exploration

(0)
(0)

Commentaires - 0

Sans commentaires

Ajouter un commentaire

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Caractères restants: 3000
captcha