Inverse et déterminant d'une matrice de flottants

Version imprimable

12/06/2017, 17h37
Smelk

Inverse et déterminant d'une matrice de flottants

Bonjour!

Je suis pas trop sûr du forum où poster cette question, j'espère que je ne me suis pas trompé.
Je rencontre un petit problème avec un algorithme que je suis en train de coder.

En gros j'ai une matrice Q de flottants (des arrondis) :
- Si la matrice est inversible (donc son déterminant != 0), je l'inverse et je m'en sers pour résoudre un système.
- Si la matrice n'est pas inversible, j'applique une autre méthode un peu moins efficace.

A priori rien de compliqué, mais je viens de réaliser qu'à cause des arrondis, j'imagine que mon déterminant n'est jamais égal à zéro. Du coup j'ai commencé à écrire un "if (det(Q) < epsilon)" mais est-ce que j'ai le droit en fait?
Dans le cas de flottants, est-ce qu'une matrice avec un déterminant de 0,0001 est inversible ou pas?

J'ai un peu peur que les erreurs que je rencontre viennent de là, et j'imagine que c'est un problème courant mais je n'ai pas réussi à trouver d'infos là dessus (je dois pas taper les bons mots-clés).

Merci d'avance!
Smelk
13/06/2017, 17h22
wiwaxia

Inverse et déterminant d'une matrice de flottants

Bonjour, :D

Tu as pressenti le coeur de la difficulté:

Citation:

Envoyé par Smelk

... je viens de réaliser qu'à cause des arrondis, j'imagine que mon déterminant n'est jamais égal à zéro. Du coup j'ai commencé à écrire un "if (det(Q) < epsilon)" mais est-ce que j'ai le droit en fait? ...

mais il faut cependant sortir d'une l'impasse, celle de la tolérance à accorder à la vérification de l'égalité T = 0 qui, en l'absence de toute autre donnée, n'a aucun sens. Ainsi lorsque tu demandes:

Citation:

Envoyé par Smelk

... est-ce qu'une matrice avec un déterminant de 0,0001 est inversible ou pas? ...

la réponse peut être affirmative ou non, selon l'ordre de grandeur des éléments non-nuls présents.

1°) Le cas le plus simple est celui de l'égalité entre deux réels positifs: A = B , réductible à la précédente: (A - B) = 0 .
En convenant de noter (E_A, E_{_B}) les incertitudes affectant chacun des termes, il est conforme à l'intuition que dans le cas de valeurs (A et B) suffisamment proches, les domaines correspondants: [A - E_A ; A + E_A] , [B - E_B ; B + E_B]
se recouvrent au moins partiellement (intersection non vide), d'où par exemple (si A > B) la condition: A - E_A < B + E_B ;
l'écart entre les deux termes admet ainsi une limite supérieure: Abs(A - B) < E_A + E_B qu'il convient d'adapter numériquement au problème à résoudre.
a) dans le cas de données expérimentales, les incertitudes (E_A, E_{_B}) découlent de l'estimation de la précision des mesures;
b) s'il s'agit de calculs théoriques, la précision est dans le meilleur des cas limitée par un seuil irréductible lié au codage des nombres flottants: c'est le "epsilon machine" caractéristique du logiciel, que l'on peut tester en cherchant le plus petit nombre vérifiant: 1 + (E_mach) > 1 ;
Pour le format Extended, il vaut 2^-63 = 1E^-19 dans le cas du Pascal et apparentés; il est plus élevé dans la plupart des autres langages.

2°) Soit maintenant le déterminant d'ordre deux: D = (<W , X> , <Y , Z>) = WZ - XY , dont on envisage l'annulation: D = 0 équivalant à WZ = XY .
Si l'on admet pour les 4 termes la même incertitude relative e = E_W/Abs(W) = E_X/Abs(X) = E_Y/Abs(Y) = E_Z/Abs(Z) , il vient:
E_WZ = Abs(W)*E_Z + Abs(Z)*E_W = Abs(W)*Abs(Z)*(e + e) = 2*e*Abs(WZ)
E_XY = Abs(X)*E_Y + Abs(Y)*E_X = Abs(X)*Abs(Y)*(e + e) = 2*e*Abs(XY) ,
et l'équation (D = 0) implique, par analogie avec ce qui a été donné au (1°), et en supposant toujours (WZ > XY):
WZ - E_WZ < XY + E_XY soit encore: WZ - XY < E_WZ + E_XY = 2*e*(Abs(WZ) + Abs(XY) ;
il vient donc plus généralement: Abs(D) < 2*e*(Abs(WZ) + Abs(XY)) < 4*e*Max(Abs(WZ), Abs(XY)) .
L'incertitude s'évalue en fonction du produit des termes diagonaux.

3°) Dans le cas d'un déterminant d'ordre (n) plus élevé, on ne peut raisonnablement que conjecturer une estimation de l'incertitude, compte tenu de la complexité des résultats - à moins que tes matrices soient d'un type très particulier.
Il faut supposer tous les éléments indépendants et affectés de la même incertitude relative (e).
Ainsi un déterminant d'ordre (3) comporte la somme algébrique de 3! = 6 termes, dont chacun est le produit de 3 éléments de la matrice, et se trouve donc affecté d'une incertitude relative égale à (3*e); d'où une incertitude absolue E_D ~ (3*6*e)*M
dans laquelle intervient la "valeur moyenne" d'un produit M = M₁ * M₂ * M₃
estimable à partir des moyennes (M_j) des valeurs absolues des éléments d'une même colonne.

Cette dernière évaluation me très paraît incertaine, et très excessive: cela ne relève plus d'un simple calcul d'incertitudes, lorsque se superposent un grand nombre de termes indépendants;

Une autre solution consisterait à entreprendre une série de calculs de déterminants (D), pour une matrice A dont les éléments sont faiblement et aléatoirement décalés par rapport à ceux d'une matrice de référence (A°), de déterminant connu (D°); cela devrait conduire à un échantillon de valeur centrale (D_m ~ D°), d'écart-type (S_D) et donc à l'intervalle de confiance: [D_m - (2*S_D) ; D_m) + (2*S_D)].
De tels essais permettraient de remplacer la condition (D = 0) en pratique inutilisable par: Abs(D) < E_D = 2 * S_D .

Inverse et déterminant d'une matrice de flottants (suite)

Exemple: soit la matrice (A°) dont le déterminant dépend d'un paramètre (x) et s'annule pour x = 5 (D = 60 - 12*x):
Code:

1 2 3 4 << 1 , 4 , 7 > A° = < 2 , x , 8 > < 3 , 6 , 9 >>
puis une seconde matrice (B) dont tous les éléments résultent d'un processus pseudo-aléatoire, mais restent proches de ceux de la précédente, et ne s'en écartent pas de plus de 1.7 % (en plus ou en moins).
Il interviendra par conséquent une double boucle d'instructions du type:
Code:

1 2 3 4 5 6 FOR i:= 1 TO 3 DO FOR j:= 1 TO 3 DO BEGIN p:= Random; q:= (2 * p) - 1; p:= 1 + (0.017 * q); B[i, j]:= p * A0[i, j] END;
On envisage, pour quelques valeurs de (x), une liste de 11 déterminants aléatoires, de laquelle on déduira la moyenne (D_m), l'écart-type (S_D) et l'incertitude définie par la relation: (E_D = 2 * S_D).
Code:

1 2 3 4 5 6 7 8 9 10 11 12 x D° Dm Ed 4.0 12.0 11.95 1.31 4.5 6.0 6.49 1.04 4.8 2.4 2.30 1.49 4.9 1.2 1.04 1.65 5.0 0.0 -0.01 1.55 5.1 -1.2 -1.57 1.77 5.2 -2.4 -2.38 1.91 5.5 -6.0 -5.98 1.90 6.0 -12.0 -12.46 1.88
On fait ainsi apparaître les cas pour lesquels le déterminant peut-être considéré comme nul (x = 4.9 , 5.0 et 5.1) ainsi que les cas discutables (x= 4.8 ou 5.2).

14/06/2017, 11h28
Smelk

Merci beaucoup pour le temps que tu as pris pour me répondre!

J'y vois déjà plus clair, et je vais reprendre ça dès que j'arrive au boulot :)

Inverse et déterminant d'une matrice de flottants

Une variante permet de s'affranchir de l'hypothèse d'une incertitude relative constante, en consignant:
a) les données expérimentales dans une première matrice (A),
b) les incertitudes absolues correspondantes dans une seconde (B);
puis en calculant les déterminants d'une suite de matrices aléatoires (C) construites terme à terme à partir des précédentes:
Code:

1 2 3 4 5 6 FOR i:= 1 TO 3 DO FOR j:= 1 TO 3 DO BEGIN p:= Random; q:= (2 * p) - 1; p:= q * B[i, j]; C[i, j]:= A[i, j] + p END;
De l'ensemble des valeurs obtenues, on déduit les résultats déjà mentionnés (D_m, S_D et E_D).

# Exemple 1:
Code:

1 2 3 4 5 6 7 8 A = ( < 800 , 700 , 950 > , < 999 , 550 , 875 > , < 950 , 822 , 948 > ) ; DA = 44 402 700 ; B = ( < 8 , 7 , 10 > , < 10 , 6 , 9 > , < 10 , 8 , 9 > ) ;
On a obtenu pour N = 20 déterminants les valeurs suivantes:
D_m = 45 198 013 ; S_D = 3 146 340 et E_D = 6 292 680 .
Dans ce cas le déterminant (D_A) dépasse très largement l'incertitude absolue (E_D), la matrice correspondante (A) est inversible.

# Exemple 2:
Code:

1 2 3 4 5 6 7 8 A = ( < 800 , 700 , 950 > , < 835 , 550 , 875 > , < 671 , 822 , 948 > ) ; DA = 55 500 ; B = ( < 8 , 7 , 10 > , < 8 , 6 , 9 > , < 7 , 8 , 9 > ) ;
On trouve cette fois:
D_m = 474 328 ; S_D = 2 583 424 et E_D = 5 166 848 .
Le déterminant, très inférieur en valeur absolue à l'incertitude, n'a plus de signification et doit être considéré comme nul.

■ Le test numérique proposé ici a le mérite de montrer indirectement ce qu'il peut advenir des valeurs calculées du déterminant; il me paraît cependant assez lourd, donc difficilement applicable au-delà de l'ordre 4 (tu n'as rien dit sur ce point, concernant tes systèmes d'équations).

On peut cependant envisager une méthode générale, en partant de l'indépendance des (n²) données contenues dans la première matrice (A), et du fait que la variation de l'une d'entre elles: b_ij = a'_ij - a_ij
entraîne une variation du déterminant qui lui est proportionnelle: D'_A - D_A = b_ij * Cof_ij(A) d'après la formule de Laplace.
Cela conduit tout naturellement au calcul de la comatrice correspondante, matrice des cofacteurs de (A): Com(A) = [Cof_ij(A)] ,
puis à la matrice (C) résultant du produit terme à terme (produit matriciel d'Hadamard) de Com(A) avec la matrice des incertitudes (B):
C = (Com(A) ║ B) .
Il ne reste plus, à ce stade, qu'à calculer la norme de Frobenius de la matrice obtenue:
N_F(C) = (S_i=1ⁿS_j=1ⁿ(c_ij)²)^1/2 , susceptible de constituer un excellent jalon.

Reprenons pour illustration numérique les deux exemples précédents:
# Ex 1: D₁ = Det(A1) = 44 402 700 ; N₁ = N_F(C1) = 4 943 371 :
déterminant incontestablement non-nul, puisque très supérieur en valeur absolue au second terme.

# Ex 2: D₂ = Det(A2) = 55 500 ; N₂ = N_F(C2) = 4 640 530 ;
déterminant quasi-nul, puisque inférieur à la limite associée.

Remarquer que les normes obtenues (~ 5E⁶) présentent le même ordre de grandeur que les incertitudes dont il était initialement question (5 à 6E⁶).

On dispose désormais, pour toute matrice, d'un test de quasi-nullité du déterminant: Abs(E_A) < N_F(Com(A) ║ B)
dispensant de toute étude statistique sur une suite matricielle pseudo-aléatoire.

Ma réponse était longue et hésitante, :D parce que ce domaine ne m'est pas familier, et que l'un de mes programmes se plantait sur un problème stupide d'arithmétique modulaire, exigeant de savoir compter jusqu'à 5 ... :ptdr:

# J'ai cherché du côté des matrices aléatoires (random matrices): beaucoup de liens, pointant sur des articles à priori intéressants, mais de niveau inabordable (au moins pour moi) - rien d'utile malheureusement, et le plus souvent incompréhensible :calim2: .

Inverse et déterminant d'une matrice de flottants

J'ai repris pour vérification la première matrice donnée en exemple au message (#3):
Code:

1 2 3 4 << 1 , 4 , 7 > << 9*x - 48 , 6 , 12 - 3*x > A° = < 2 , x , 8 > ; Com(A°) = < 6 , -12 , 6 > ; B = 0.017 * A° ; < 3 , 6 , 9 >> < 32 - 7*x , 6 , x - 8 >>
On obtient alors: N_F(Com(A°) ║ B) = 0.017 * N_F(Com(A°) ║ A°) = .017 * (1188*x² - 9720*x + 28080)^(1/2)
et pour les valeurs précédemment envisagées du paramètre (x):
Code:

1 2 3 4 5 6 7 8 9 10 11 12 x D° N_F 4.0 12.0 1.54 4.5 6.0 1.56 4.8 2.4 1.59 4.9 1.2 1.61 5.0 0.0 1.63 5.1 -1.2 1.65 5.2 -2.4 1.67 5.5 -6.0 1.75 6.0 -12.0 1.90
Mêmes observations, mêmes conclusions.
La variation observée pour la norme (N_F) est par ailleurs beaucoup plus régulière que celle de la dispersion des échantillons pseudo-aléatoires successifs (S_D = E_D / 2).

17/06/2017, 14h08
dourouc05

:salut:

En repassant sur la discussion : as-tu vraiment besoin de l'inverse de la matrice ? C'est une opération horriblement coûteuse à effectuer et numériquement pas très stable, surtout en comparaison de la résolution d'un système linéaire (voir, par exemple, https://www.johndcook.com/blog/2010/...t-that-matrix/).
21/06/2017, 11h34
Smelk

Bon, n'ayant pas un niveau incroyable en mathématiques, je dois avouer que je me suis un peu perdu dans tes explications, wiwaxia, ou en tout cas sur comment appliquer tout ça concrètement à mon problème :oops:

dourouc05, merci pour la suggestion! Effectivement, je peux peut-être m'en sortir en résolvant directement le système, je n'avais pas pensé à ça. Je vais voir ce que ça donne!
21/06/2017, 20h16
souviron34

euh....

Je me permet d'intervenir...

Outre la solution mathématiquement élégante et correcte de notre ami wiwaxia, qui est cependant complexe, et celle évitant le problème de dourouc05, je m'en vais vous en proposer une plus simple (à mon avis ;) c'est mon esprit physicien qui parle) :

Les flottants en question étant des arrondis (on pourrait le faire sans cela, mais cela nécessiterait un peu plus de calculs), on connait la "taille" de l'arrondi : nombre de chiffres après la virgule = d .. (qui doit être 2 ou 3 je suppose)

Il suffit de multiplier tous les flottants par 10^d , et résoudre le calcul du déterminant.. avec des nombres entiers...

Le résultat sera juste à multiplier par 10^-d

Me trompe-je ???
21/06/2017, 21h35
tbc92

Si j'ai une matrice 3x3, et si j'ai multiplié chaque nombre par 100 pour travailler avec des entiers, alors le déterminant a été multiplié au passage par 1000000, et pas par 100.

Mais il peut y avoir des effets de bord plus vicieux. Si je me souviens bien, le signe du déterminant, ça permet de savoir si le repère formé par nos 3 vecteurs est direct (pouce/index/majeur de la main droite), ou bien indirect (pouce/index/majeur de la main gauche). Et pour un simple problème d'arrondi, un repère peut paraître direct, alors qu'il est indirect.
21/06/2017, 21h56
souviron34

Citation:

Envoyé par tbc92

Si j'ai une matrice 3x3, et si j'ai multiplié chaque nombre par 100 pour travailler avec des entiers, alors le déterminant a été multiplié au passage par 1000000, et pas par 100.

Mais il peut y avoir des effets de bord plus vicieux. Si je me souviens bien, le signe du déterminant, ça permet de savoir si le repère formé par nos 3 vecteurs est direct (pouce/index/majeur de la main droite), ou bien indirect (pouce/index/majeur de la main gauche). Et pour un simple problème d'arrondi, un repère peut paraître direct, alors qu'il est indirect.

OK pour la valeur du déterminant...

Mais pour l'autre, je vois pas trop..

Le PO dit dans son premier post que ses nombres représentent des arrondis.... : "En gros j'ai une matrice Q de flottants (des arrondis)" ... On peut si on veut ajouter une ou 2 décimales, mais ses nombres seront de la forme xxx.yyy ... Etant donné que ce qu'il y a derrière (dans un stockage informatique) n'a pas de signification, la prise en compte des résultats lors d'opérations n'en a pas non plus...

Si donc le repère est direct avec ses chiffres (par exemple où on met 000000000000 apres le dernier chiffre de l'arrondi jusqu'à remplir le nombre de bits disponible) ça ne changera strictement rien si on fait l'opération en entier après avoir multiplié... Certainement pas le signe... Et justement ça évite les effets de bords de calculs avec des flottants dont on ne connait pas ce que l'ordi met derrière le dernier chiffre significatif (suivant comment les nombres ont été calculés ou intialisés)

Si ??
21/06/2017, 23h56
tbc92

Tu as raison, en multipliant par 100 ou 1000, on ne génère pas d'erreur nouvelle. Mais on ne corrige pas les erreurs existantes.

Pour revenir à la question initiale, il ne faut pas tester : if det(Q) < epsilon mais if |det(Q)| < epsilon (mettre des valeurs absolues). Ca paraît une première précaution.

Par curiosité, j'essaierais aussi la méthode ci-dessous :
1. Calculer Det(Q) , et vérifier si |det(Q)| < epsilon
2.Pour chacun des nxn termes de ma matrice, le remplacer en enlevant 0.00000001, et calculer le nouveau déterminant avec ce changement. Idem en ajoutant 0.00000001. A chaque fois , on a un des termes qui est différent de la valeur d'origine, tous les autres sont inchangés. Et on regarde tous les déterminants obtenus. Si parmi ces n*n*2+1 expériences on obtient parfois des déterminants positifs, et parfois des déterminants négatifs, alors danger. On peut certainement considérer que le vrai déterminant est nul.

Il n'y a aucune rigueur mathématique derrière tout ça. Juste des tentatives.
22/06/2017, 00h54
souviron34

juste un petit rajout expérimental là-dessus :

lors de tous les algos de maths opérationnels que j'ai fait, quand j'avais à tester par rapport à 0, sur des flottants (des doubles en C), en général une valeur de 10^-8 pour epsilon est correcte...

C'est pifométrique/empirique, mais ça marche bien sur toutes les machines/OS que j'ai eu : HPUX, Irix, Linux, 32 ou 64 bits...

Pour tous les algos que j'ai utilsé, y compris pour des problèmes d'intersections ou pas...

Inverse et déterminant d'une matrice de flottants

Bonsoir, :D

Ce problème intéressant mais inédit m'a paru apparenté à la loi de probabilité de Gauss et à un mouvement brownien, sans que je puisse donner, pour sa solution, une formulation claire et facilement compréhensible.
J'ai donc indiqué une série d'opérations intuitives, en m'assurant du terme exact désignant chacune d'entre elles, afin que chacun se procure éventuellement la documentation nécessaire.
Mais à vouloir trop bien faire, peut-être que la présentation apparaissait résolument glaçante pour un lecteur débutant :aie:, je reviendrai donc sur la réponse apportée, afin que Smelk ne reste pas sur son impression de découragement.

Il y a eu des commentaires inattendus.

Citation:

Envoyé par souviron34

... Les flottants en question étant des arrondis (on pourrait le faire sans cela, mais cela nécessiterait un peu plus de calculs), on connait la "taille" de l'arrondi : nombre de chiffres après la virgule = d .. (qui doit être 2 ou 3 je suppose)
Il suffit de multiplier tous les flottants par 10^d , et résoudre le calcul du déterminant.. avec des nombres entiers[/SUP] ...

Tous les résultats (D_A, E_A, N_F) seront effectivement multipliés par le même facteur: 10^n*D dans le cas de matrices d'ordre (n); je me suis assuré de leur homogénéité. Et la question de l'incertitude ne disparaîtra pas pour autant: la donnée u = 0.523 ±0.007 équivaut à u' = 523 ±7 .
Mais n'est-ce pas une fuite en avant, avec d'éventuelles complications ? Des données comportant 4 chiffres significatifs conduiront à des résultats à 12 chiffres pour des matrices (3x3); que se passera-t-il à des ordres plus élevés ? Devra-t-on passer en précision absolue ?
D'autant plus que si chaque terme n'est connu qu'à (10^-4) près, le résultat sera affecté d'une incertitude relative (n) fois plus grande (estimation très grossière - voir les calculs précédents) ... Quel est l'intérêt de travailler sur de grands nombres entiers ?

Citation:

Envoyé par tbc92

... Mais il peut y avoir des effets de bord plus vicieux. Si je me souviens bien, le signe du déterminant, ça permet de savoir si le repère formé par nos 3 vecteurs est direct (pouce/index/majeur de la main droite), ou bien indirect (pouce/index/majeur de la main gauche). Et pour un simple problème d'arrondi, un repère peut paraître direct, alors qu'il est indirect.

Que le déterminant de 3 vecteurs orthogonaux puisse changer de signe, cela suppose une incertitude absolue énorme sur les données !
Voilà un exemple simple:
Code:

1 2 3 4 << 1 , 0 , 0 > << e , e , e > << 1 , 0 , 0 > A = < 0 , 1 , 0 > ; Da = 1 ; B = < e , e , e > ; Com(A) = < 0 , 1 , 0 > < 0 , 0 , 1 >> < e , e , e >> < 0 , 0 , 1 >>
Il vient dans ces conditions: C = Com(A)║B = e * A et N_F(C) = (3 * e²)^1/2 = 3^1/2 * e ;
il faudrait donc pour une éventuelle inversion de signe: e>~ D_A / 3^1/2 ~ 0.6 , soit 60 % .

22/06/2017, 01h30
souviron34
Citation:

Envoyé par wiwaxia

Tous les résultats (D_A, E_A, N_F) seront effectivement multipliés par le même facteur: 10^n*D dans le cas de matrices d'ordre (n); je me suis assuré de leur homogénéité. Et la question de l'incertitude ne disparaîtra pas pour autant: la donnée u = 0.523 ±0.007 équivaut à u' = 523 ±7

Tu supposerais (c'est normal, en matheux ;) ) que l'on connait la précision absolue ±7.

En général quand on arrondi en info, c'est simplement ±5 mais on n'en tient pas compte après .. : on arrondi en faisant :

valeur_arrondie = (int)(valeur + 0.50)

Donc après ça a disparu... donc 0.523 <=> 523

Citation:

Envoyé par wiwaxia

Quel est l'intérêt de travailler sur de grands nombres entiers ?

Aucun a priori, c'était juste pour proposer une autre solution :P

Si, quand même, ça évite la propagation d'erreurs des flottants lors des calculs.... Etant donné qu'ils sont à d décimales, si on est sur une machine 32 bits par exemple la précision normale est de 10^-17. Donc toute opération propage l'erreur sur les n chiffres après les d (+ la mantisse). En faisant ça on tronque (ce qu'on peut faire aussi en ajoutant un 0 après le dernier chiffre significatif) : 15.540 == 15.5400000000000000000.

Alors que sinon on peut très bien avoir : 15.5423579785544 ce qui peut donner pas mal de différences à la fin...

Tout dépend comment on a obtenu les chiffres....

Mais globalement le point suivant éclaire ce qu'il faut ;)

Citation:

Envoyé par Smelk

Dans le cas de flottants, est-ce qu'une matrice avec un déterminant de 0,0001 est inversible ou pas?

Suivant que tu sois en 32 bits ou en 64, il y a une table qui donne la valeur "0" considérée par l'ordinateur.. En C elle s'appelle "limits.h" et maintenant "float.h".
Donc le meilleur moyen de tester est par rapport à cette valeur FLT_EPSILON ou DBL_EPSILON ...

Donc pour tester si un dénominateur ou un déterminant est "0" au sens de l'ordi, tu peux tester par rapport a cette valeur... ou comme je disais dans le message au-dessus, sinon par rapport à 10^-8 c'est OK dans 99.99999% des cas... (en double)

donc :

si |det| > FLT_EPSILON c'est OK....
22/06/2017, 01h40
tbc92

Citation:

Envoyé par wiwaxia

Bonsoir, :D

Que le déterminant de 3 vecteurs orthogonaux puisse changer de signe, cela suppose une incertitude absolue énorme sur les données !

Je partais de 3 vecteurs qui forment un repère direct (ou indirect), mais sans plus de précision, en particulier, sans parler de vecteurs orthogonaux, ni normés...
Par exemple, sauf erreur (1,0,1), (0,1,1) et (1,1, 1.415) est direct, alors que (1,0,1), (0,1,1) et (1,1, 1.413) est indirect.

Citation:

Envoyé par tbc92

Je partais de 3 vecteurs qui forment un repère direct (ou indirect), mais sans plus de précision, en particulier, sans parler de vecteurs orthogonaux, ni normés...

Mon exemple était effectivement mal choisi: j'aurais dû envisager des directions beaucoup plus proches.

Citation:

Envoyé par tbc92

... Par exemple, sauf erreur (1,0,1), (0,1,1) et (1,1, 1.415) est direct, alors que (1,0,1), (0,1,1) et (1,1, 1.413) est indirect.

Tu as sans doute voulu écrire:

Citation:

... Par exemple, sauf erreur (1,0,1), (0,1,1), (1,1, 1.415²) est direct, alors que (1,0,1), (0,1,1) et (1,1, 1.413²) est indirect.

puisqu'alors D₁ = 0.002225 , D₂ = -0.003431 , et que d'une manière plus générale le déterminant de la matrice
((1 , 0 , 1) , (0 , 1 , 1) , (1 , 1 , x²)) admet pour expression générale D = x² - 2 et s'annule en x = 2^1/2 ...

Tu fournis là un exemple numérique tout à fait approprié, où les incertitudes d'arrondi dû au fonctionnement du coprocesseur (10^-8 , pour reprendre l'estimation de souviron34) sont bien trop faibles pour affecter le signe du déterminant.
Supposons toutes les données non-nulles (de valeur 1 ou x) connues avec une précision p = 1E^-3 = 1 / 1000 ; il en découle des incertitudes absolues égales à p*1 (pour les 4 premiers termes) et 2*p*x² pour le dernier (d(x²) = 2*x*dx = 2*x*(p*x) = 2*p*x²).
Tout cela conduit aux résultats:
Code:

1 2 3 4 << 1 , 0 , 1 > << x2 - 1 , 1 , -1 > < A = < 0 , 1 , 1 > ; Da = x2 - 2 ; Com(A) = < 1 , x2 - 1 , -1 > ; B = < 0 , p , p > < 1 , 1 , x2 >> < -1 , -1 , 1 >> 2 >>
... et l'on obtient: N_F(C) = p*(6 - 4*x² + 6*x⁴)^1/2 ~ 4.7E^-3 au voisinage de x = 1.414 .
Résultats dépourvu d'ambiguïté: N_F(C) > Abs(D_A) dans les deux cas: le signe du déterminant obtenu n'a ici aucun sens, et doit être considéré comme nul.(1)

Les arrondis liés à l'emploi des flottants constituent un bruit de fond que l'on ne peut supprimer, mais sont le plus souvent très inférieurs à l'incertitude des données injectées dans les calculs.
Aucun programmeur n'aurait l'inconséquence d'utiliser des flottants codés sur 4 octets (p = 2^-31 ~ 10^-9 ou moins (je ne connais pas exactement la norme courante) pour entreprendre des calculs sur des données à 12 chiffres significatifs.

En ce qui me concerne, une manie irrépressible :aie: de la précision maximale me conduit à l'emploi exclusif des flottants de type Extended (p = 2^-63 ~10^-19) - sauf pour POV Ray, codé en C#.
La question de l'annulation d'un réel ne se pose donc pour moi qu'en dessous de 10^-18; il reste ainsi de la marge.

Je comprends cependant que l'on recoure à d'autres formats pour des raisons de rapidité, ou d'économie de mémoire.

(1) PS: résultats conformes à l'intuition puisque les domaines des données (1.415 ±0. 0014) et (1.413 ± 0.0014) recouvrent partiellement celui du zéro du déterminant (1.4142 ± 0.0014) .
Et au contraire, le passage à la précision limite (p = 10^-8) liée au format des flottants utilisés conduit pour la dernière matrice (C) à une norme 100000 fois plus faible: N_F(C) ~ 4.7E^-8 < Abs(D₁) et Abs(D₂); les déterminants apparaissent désormais non-nuls.

24/06/2017, 16h30
wiwaxia

Inverse et déterminant d'une matrice de flottants
@ Smelk et sans doute quelques autres, découragés comme lui par l'aspect rébarbatif de la solution proposée (#5).

# Une incertitude absolue sur une grandeur (X) est la limite supérieure des valeurs absolues des écarts observables sur la grandeur considérée:
E_X = Max(Abs(X' - X)) .
Elle correspond, dans le cas des données expérimentales, à la précision des mesures effectuées; dans le cas par exemple de X = 1.545 , on aura en l'absence de toute autre indication: E_X = 0.0005 (selon la norme AFNOR).
Elle admet pour limite inférieure la précision du stockage en mémoire des nombres flottants: si (N_m) bits sont réservés à leur mantisse, elle doit valoir
E_X = X*2^-N_m (si je me trompe :D, souviron34 apportera les corrections nécessaires).

Voir Virgule flottante, IEEE 754

# Le déterminant (D) d'une matrice, calculé à partir des (n²) éléments de l'objet, est lui aussi entaché d'une incertitude (E_D) qu'il importe d'évaluer, puisqu'on peut le considérer comme quasiment nul à la condition: Abs(D) <~ E_D . Là réside l'originalité et l'intérêt de la question posée.
Il ne s'agit pas d'un simple calcul de petites variations: la réponse eût été donnée en deux lignes; il faut évaluer l'erreur moyenne (ou maximale, peu importe) résultant de la superposition de nombreuses petites variations, dont on ne connaît que la limite supérieure (en valeur absolue).

1°) Notion de comatrice (matrice des cofacteurs)
a) C'est la notion au départ la plus difficile, en raison du caractère abstrait de sa notation; et pourtant le calcul de ses éléments s'apparente étroitement à ce que tu connais déjà. Cela vaudrait le coup, pour toi, de t'investir sur ce point.
Par exemple le calcul d'un déterminant (3x3) fait intervenir trois cofacteurs (sans qu'ils soient expressément nommés); ainsi pour la matrice (A) provisoirement notée sans indices
Code:

1 2 3 4 << r , u , x > A = < s , v , y > < t , w , z >>
le développement du déterminant par rapport aux éléments de la première colonne conduit à l'expression:
D = r*(v*z - w*y) + s*(w*x - u*z) + t*(u*y - v*x)
à rapprocher de l'expression théorique:
D = a₁₁*Cof₁₁(A) + a₂₁*Cof₂₁(A) + a₃₁*Cof₃₁(A) .
Le développement par rapport aux éléments de la 2^de ou 3^me colonne conduirait semblablement aux six autres cofacteurs.

b) Soit maintenant une autre matrice A', ne différant de la précédente que par l'un de ses éléments (celui en ligne 2, colonne 1, par exemple):
Code:

1 2 3 4 << r , u , x > A' = < s' , v , y > < t , w , z >>
l"écart entre la nouvelle valeur du déterminant D' = a₁₁*Cof₁₁(A) + a'₂₁*[Cof₂₁(A) + a₃₁*Cof₃₁(A)
et l'ancienne découle immédiatement de la définition donnée plus haut:
D' - D = (a'₂₁ - a₂₁)*[Cof₂₁(A) .

2°) Le déterminant comme fonction. Chaque cofacteur apparaît comme la dérivée partielle du déterminant par rapport à l'élément correspondant: Cof_ij(A) = (dD/da_ij) (désolé pour la notation !).
On pourrait donc envisager l'expression approchée de la variation du déterminant en fonction des variations élémentaires de chacun des éléments de la matrice (h_ij = a'_ij - a_ij) par la combinaison linéaire des (n²) produits:
D' - D = S_i=1ⁿS_j=1ⁿ(Com_ij(A) * h_ij) ,
qui correspond à la formule citée sur ce lien: Det(A + H) = Det(A) + Tr(^tCom(A).H) + o(║H║) . (1)
Cependant le problème est d'établir une limite supérieure pour Abs(D' - D), connaissant celles de Abs(h_ij); d'où la nécessité de consigner:
a) dans une matrice (B) les incertitudes absolues affectant les élément de (A): b_ij = E(a_ij) = Max(Abs(h_ij)) ;
b) dans une autre matrice (C) les produits correspondants c_ij = Cof_ij(A) * b_ij .

3°) On pourrait à ce stade en déduire l'incertitude absolue sur le déterminant: E_D = Max(Abs(E' - E)) = S_i=1ⁿS_j=1ⁿ(Abs(c_ij)) ;
un tel résultat résulte néanmoins d'une majoration outrancière, parce que le fait que toutes les variations (h_ij) soient simultanément extrêmales et de même signe a très peu de chances de se produire.
C'est pourquoi l'expression finalement retenue: E_D = (S_i=1ⁿS_j=1ⁿ(Abs(c_ij)²))^1/2 = (S_i=1ⁿS_j=1ⁿ(c_ij²))^1/2 = N_F(C) (1)
constitue une bien meilleure estimation: à précision fixe, (E_D) régresse proportionnellement de (n²) à (n).
C'est à cette étape que doit intervenir la loi de probabilité de Gauss. Mais cela nous mènerait vraiment trop loin :D .

(1): Tr(M) désigne la trace d'une matrice, ^tM sa transposée et (X.Y) le produit matriciel standard.
Tr(^tX.Y) correspond à la somme de tous les produits (x_ij*y_ij) - à vérifier stylo en main ! Il s'agit d'une extension du produit scalaire.
Au sujet de la norme de Frobenius, j'aurais dû parler de "norme euclidienne", expression beaucoup plus parlante:
N_F(X) = ║X║ = Tr(^tX.X)^1/2 .

Voir Norme (mathématiques)
Norme matricielle
Normes
Le site de Gilles Dubois devrait être consulté beaucoup plus souvent par tous ceux qui, comme moi :D , ont quelques lacunes en maths.