# Trucs et astuces plus avancés en numpy

## Fonction de recherche `np.where`


In [None]:
import numpy as np

In [None]:
a = np.random.randn(100,2)

# element de la premiere colonne < 0.5
index = np.where(a<0.5) # retourne les indices dans (I,J)
 # I: indice des lignes
 # J: indice des colonnes

# recherche dans une colonne
index2 = np.where(a[:,0]<0.5)

**Attention au type de retour**

Le type de `index` est sans surprise... Mais celui de `index2` est plus déroutant: il s'agit d'un tuple mais avec un seul champ rempli...
Pour utiliser les indices extraits facilement, il faut donc faire:

In [None]:
index2, = np.where(a[:,0]<0.5) # on ne s'intéresse qu'au premier membre!
# a[index2,:] = ...

## Fonction de recherche en syntaxe légère


In [None]:
y = np.array([-1, -1, -1, 1, 1, 1])
x = np.random.rand(6,2)

# sélection des 3 premières lignes de x
print(x)
print(x[y==-1])

# contraintes logiques: 
# - x et y doivent avoir la même taille
# - y doit être un vecteur

# sélection des lignes de x qui commencent par un nombre > 0.5
print(x[x[:,0]>0.5])


## Transformation de matrice

`np.where` permet de renvoyer une matrice transformée en ajoutant des arguments dans la méthode

> `np.where(m > alpha, retour_si_vrai, retour_si_faux)`

On peut se servir de cette syntaxe pour faire des comptages

In [None]:
a = np.random.randn(100,2)
# Mettre à zeros tous les éléments négatifs:
b = np.where(a<0., 0., a) # (clause, TODO if true, TODO if false)
c = np.where(a<0., -1., 1.) # Extraire le signe des éléments de a

nb_elem_pos = np.where(a>0., 1, 0).sum() # construction d'une matrice binaire + somme = comptage

## ATTENTION aux doubles clauses

il y a un piège dans la priorité donnée aux opérations: il faut ajouter des parenthèses

In [None]:
# pour l'estimation d'une loi jointe entre a et b
N = 100
a = np.ceil(np.random.rand(N) * 10) # entre 1 et 10
b = np.round(np.random.rand(N)) # 0 ou 1
np.where((a == 4) & (b==0), 1., 0.) # OK
# np.where( a == 4 & b==0 , 1., 0.) # KO !!! => le & est prioritaire sur le == !!!

# Exercice d'application

Générer 1000 tirages selon une loi normale centrée réduite
 - Vérifier que la moitié (environ) des tirages est supérieure à 0
 - Vérifier que 2/3 des tirages sont compris entre entre moins l'écart-type et plus l'écart type