]> AND Private Git Repository - book_chic.git/blob - chapter1.tex
Logo AND Algorithmique Numérique Distribuée

Private GIT Repository
533d289ad8f671991fb707aa8764519d84c9c694
[book_chic.git] / chapter1.tex
1 %%%%%%%%%%%%%%%%%%%%% chapter.tex %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
2 %
3 % sample chapter
4 %
5 % Use this file as a template for your own input.
6 %
7 %%%%%%%%%%%%%%%%%%%%%%%% Springer-Verlag %%%%%%%%%%%%%%%%%%%%%%%%%%
8 %\motto{Use the template \emph{chapter.tex} to style the various elements of your chapter content.}
9 \chapter{Paradigmatic overview of Implicative Statistical Analysis.
10 When? Why? How?}
11 \label{intro} % Always give a unique label
12 % use \chaptermark{}
13 % to alter or adjust the chapter heading in the running head
14
15
16
17 \abstract{This prologue first of all presents the origin of the fundamental situation in which the need to organize students' response behaviours to a mathematics test appeared, illustrating the a priori complexity of exercises. 
18 Through a generative process, this led to the creation of an
19 implication index between response items, to evaluate quasi-rules such
20 as: "if a then generally b", then to representations of the partial
21 preorder obtained between responses.
22 The theory, called Statistical Implicative Analysis (SIA), was
23 developed under the impetus of the various applications encountered,
24 first by extending the nature of the behaviour variables to non-binary
25 variables of various types, then to the notion and representation of
26 rules of rules.
27 Finally, a dual topological relationship was established between the
28 subjects and the variables.
29 This development is ongoing.
30 It opens onto a vast space of paradigmatic research because it combines a set of problems to be studied and techniques specific to their study.}
31
32 \section{Introduction}
33 %\label{sec:1}
34 Statistical Implicative Analysis (SIA) was created by Régis Gras,
35 during his 66 years of service in the National Education system in
36 France (from kindergarten to university). During these years, he had
37 the opportunity to mix many ingredients into a jubilant and passionate
38 set.
39 With this 
40 composition of the pot, he proposes to tell you the genesis, the history
41 of the SIA, its purpose, its epistemological foundations, its
42 developments, without going into the technical details, in short by
43 appealing only to the common sense and intuition\footnote{Régis would like
44   to cite
45   M. Foucault in~\cite{Foucault} p. 103,
46   that can be translated in English as "... there is no true knowledge except by intuition, that is, by a singular act of pure and attentive intelligence, and by deduction, which links the evidence together".} of the reader. In
47 fact, he would like to respect the advice of P. Valéry (Cahiers, II, La
48 Pleiade, p. 823) who reproaches the mathematician for not showing "the
49 origin of the choice of such an initial convention, which is more or
50 less justified by its use and subsequently. And further on (translated
51 in english): "... explain
52 what you want, what you will do and by what means". And yet this is Régis' will.
53
54
55
56 \section{Psycho-didactic problem}
57 %\label{sec:2}
58 During the 1970s, in France, as part of the Institutes of Research on
59 Mathematics Teaching, Régis once again attended French secondary
60 classes, particularly lower secondary classes (11 to 15 years old),
61 after his teenage years.
62 He conducted and evaluated a national pedagogical experience, while
63 participating in the in-service training of adults and the research of
64 teachers in these classes.
65 He has therefore witnessed the learning difficulties of students, both
66 young\footnote{Régis has even replaced teachers in each of the primary education levels.} and old, and sometimes the attempts to remedy the obstacles to
67 the assimilation of the concepts taught in mathematics.
68 Through missions carried out within the framework of French
69 Cooperation in French-speaking Africa, the Middle East, Latin America
70 and Canada; he noted that these obstacles were not always encountered
71 by all students, but that some of these obstacles were recurrent and
72 relatively shared.
73 Their nature was didactic but also often epistemological, opposing or
74 slowing down the acquisition of their knowledge\footnote{Régis would like
75   to cite
76   G. Bachelard in \cite{Bachelard} 
77   that can be translated in English as "It is in terms of obstacles that the problem of scientific knowledge must be raised".}.
78 These regularities, these behavioural rules that exposed themselves,
79 referred, as Lévi-Strauss says in~\cite{Levi-strauss}, chapter 1, to both natural and cultural
80 processes, which it was a question of identifying, if possible
81 anticipating, analysing, understanding and on which it was ultimately
82 a question of acting.
83
84
85 Régis could observe these learning problems both directly through the
86 students' attitude or oral expression, but also through questionnaires
87 or written assignments.
88 Assuming that response attitudes or behaviours were generally
89 identifiable by these methods, he had data consisting of traces left
90 by the students.
91 When solving mathematical exercises or problems, a certain hierarchy
92 of difficulties segmented all the students interviewed and their
93 answers.
94 As the difficulty increased, the number of successes decreased, which
95 may seem like a tautology: indeed, we can expect that any student who
96 passes a test considered difficult, in a context that would be
97 comparable, would succeed a fortiori in what was easy.
98 What may {\bf surprise and challenge it} are the inconsistencies with this
99 expectation.
100 The idea that the difficulty a priori could be objectively defined by
101 Régis practice and the students' supposed knowledge no longer held
102 strictly as a predictor, even if it was most often respected.
103 Also, it was the potentially stable and relatively predictable
104 relationship between successes and failures, between response
105 behaviours, that interested him rather than the success or failure of
106 a given item.
107 This is in line with the opinion of H. Poincaré who says "that
108 mathematicians do not study objects but the relationships between
109 objects".
110
111
112
113 Hence the idea, in order to help teachers in the evaluation of a level
114 of acquisition of a given mathematical concept and in a project to
115 construct calibrated tests, to model presupposed levels of
116 acquisition, in a {\bf taxonomy of cognitive objectives}.
117 This one, like the one of Bloom (Bloom B. et al, "Taxonomie des objectifs
118 pédagogique", Education Nouvelle, Volume 1, Domaine Cognitif, 1969),
119 the best known and major tool in objective-based pedagogy, aimed to
120 organize a priori, according to an order of increasing complexity\footnote{Régis temporarily confuses the two concepts: "difficulty" and "complexity" which, although comparable and related, fall into different fields, one subjective, the other objective. }
121 after and through a task analysis, the control or appropriation of a
122 concept (and not the moments of its learning).
123 For example, an objective expressed in terms of the use of an
124 algorithm would be considered less complex than an objective requiring
125 the construction of a counter-example.
126 A causal relationship would underlie this hypothesis: the cognitive
127 tools of a higher objective would be sufficient to those mobilized by
128 the student for a lower-level objective, such as a "consequence" or
129 "effect" would be the result of a "cause".
130 In other words: "solving a complex exercise" would imply "solving a
131 less complex exercise" and its proven success would make it a {\bf good
132 predictor}.
133
134
135 Let us immediately note the difference between the information
136 instilled by correlation, a tool of symmetrical statistical proximity,
137 and the one whose function Régis refers to above, which is not
138 symmetrical.
139 Let us read again, for example, together a paragraph from E. Todd's
140 book ("Où en sommes nous?", p. 148, Seuil, 2017), on his desk today
141 (translated in english): ``through a cartographic approach, we observe
142 the coincidence in Europe of 3 elements of social structure between
143 1900 and 1930: the founding family, the Lutheran religion and a high
144 educational level. However, we cannot stop at this point and decree,
145 for example, that the family has fostered the emergence of
146 Protestantism, which in turn has demanded that people learn to read.
147 We need to imagine and describe more complex historical interactions.
148 This is indeed what we are aiming for, in another situation, through taxonomy''. 
149
150 With regard to a questionnaire composed of items specifying each of
151 the cognitive objectives of taxonomy, in theory, one could have
152 expected successes organized linearly according to the complexity a
153 priori.
154 Which, as Régis said, has not been observed.
155 The presumed total order has been replaced by a {\bf partial preorder}, as
156 defined by Piaget's differential stages of child development.
157 We approach this question with more attention in chapters 10 and 11 of
158 this book.
159 The observation of this partial preorder indicates that students could
160 in some cases and for some of them, succeed at an item considered
161 difficult while failing at an item b considered easier.
162 This is without calling into question the assertion that "generally
163 success at a is accompanied by success at b" and without its
164 reciprocal being necessarily true.
165 Régis' interest will then focus on this type of non-symmetrical
166 relationship, trying to weight, by an inductive operation, the quality
167 of its approximate character and to organize if possible all the pairs
168 of items variables at stake of this partial preorder\footnote{A preorder on a set E is a reflexive (all x of E is in relation to itself) and transitive (if x is in relation to y and y in relation to z then x is in relation to z) binary relationship.  It is partial if some elements are not linked to any other. This is the case, for example, of a preferential relationship.}.
169
170
171 What {\bf statistical tools} were then available to Régis to qualify
172 and quantify this non-symmetrical relationship between two items,
173 i.e. two variables?
174 A parametric test that is not symmetrical? but to refute what
175 hypothesis? that the students who responded to $a$ also reponded to
176 $b$? what to do with the refutation? put it away for further study?
177 draw up a list of rejected or accepted cases? no, because of the
178 absence of an overall structure expected from such a list.
179 Use the link measurement between two variables based on their {\bf
180   correlation}?
181 But this measure quantifies the quality of
182 co-occurrences, the concomitance and is therefore symmetrical and
183 therefore ineffective and inappropriate in this case.
184 Use a {\bf
185   multidimensional data analysis method} to organize relationships
186 into a whole?
187 Régis had then collaborated with J.P. Benzecri~\cite{Benzecri} on {\bf Correspondence
188   Analysis (C.A.)} and I.C. Lerman~\cite{Lermanb} on {\bf hierarchical
189   classification} and, very often, taught and used their analysis
190 methods.
191 But their theoretical foundations are essentially {\bf symmetrical}.
192 Régis' reservation regarding their methods was the same as for
193 correlation.
194 Moreover, emphasizing the fundamental difference in points of view, a
195 set metaphor illuminated the difference and facilitated the intuitive
196 understanding of the problem of the quasi-implication of the variable
197 $a$ on the variable $b$.
198 Here it is: among the population of subjects concerned by the study of
199 involvement "if $a$ then a generally $b$", subset A of the subjects
200 who satisfy $a$ is almost contained in subset B of the subjects who
201 satisfy $b$.
202 We know that if involvement is strict A is contained in B.
203 There remained the {\bf Bayesian theory} which offers the means to
204 calculate what is called the "causal probabilities".
205 It is very effective but, with reservations because it seems to Régis
206 to have less sensitivity to sample sizes (embarrassing in statistics)
207 and somewhat overwhelms rare cases.
208 Circumstances that SIA will avoid and that Yves Kodratoff~\cite{Kodratoff} has
209 expressed through the research, which he considers necessary, "nuggets
210 of knowledge".
211
212 As an epistemological starting point, Régis therefore had to establish
213 a measure, an {\bf index}, between 0 and 1 for example, capable of
214 accounting for "deviance", the gap between {\bf prediction} and {\bf contingency},
215 i.e. between what was expected from the order a
216 priori\footnote{Translation in English of~\cite{Levy-Leblondb} p. 35 "Contrary to common opinion, the great affair of science is less the production of absolute and universal truths or the recognition of redhibitory errors, than the delimitation of the conditions for the validity of statements..."}  (A is
217 included in B in the overall metaphor) and what was actually observed,
218 namely a {\bf rule of quasi-implication} "{\bf if a then generally b}".
219 The strategy he used at that time, in 1978, was to take into
220 consideration the dissatisfaction with the involvement, which, as we
221 know, is satisfied as soon as $a$ is true, $b$ is false (for example: "it
222 is raining and I am not taking my umbrella").
223 It is therefore the {\bf counter-examples} to the implicit rule "if $a$ then
224 $b$" (for example, "if it rains then I take my umbrella"), to which my
225 attention will be drawn.
226 As Régis wished it an inductive virtue, he had to take into account
227 the size of the populations concerned: total number of pupils, number
228 of those who satisfy a and do not satisfy b.
229 Moreover, without information on the population or on the existence of
230 a relationship between the variables studied, he assumed that there
231 was {\bf no a priori link} between them, as I.-C. did. Lerman (1981), as is
232 common in non-parametric tests and as expressed by H. Atlan and
233 B. d'Espagnat\footnote{Translated in English from \cite{Atlana} p.160
234   "...[in agreement with Jung] if the frequency of coincidences does
235   not significantly exceed the probability that they can be calculated
236   by attributing them solely to chance, excluding hidden causal
237   relationships, we certainly have no reason to suppose the existence
238   of such relationships". In \cite{Espagnat}, p. 186 ", Bernard would
239   speak of (translated in English) " influence in these terms: "Events A significantly influence events B if and only if the frequency with which events B take place is (significantly) different depending on whether or not events A are imposed to exist"}.
240 The objective is, if possible, to preserve and qualify it by
241 highlighting the low probability of derogation from the rule on
242 statistical bases.
243 A good illustration of the adage: "{\bf exception that proves the rule}". 
244
245 \section{A statistical measure of quasi-implication. Associated representations}
246
247 Let's move on. The strategy was therefore as follows: if the pass-fail
248 variables, {\bf boolean} in this case, were random and independent,
249 the number of random counter-examples to the quasi-implication rule
250 would follow a certain probability law, definable on the basis of
251 sample sizes.
252 If the number of counter-examples expected with probability $p$ is
253 greater than the number of counter-examples observed, the rule with a
254 {\bf quality measure} $p$ reflecting the difference between what is expected
255 and what is actually observed is accepted.
256 This probability has been called {\bf implication intensity}, as such,
257 it is identified with a probability scale, a property that other
258 numerical indices such as the Guttman scale, Loevinger or Shapiro
259 indices, for example, do not possess.
260 It represents a kind of {\bf statistical astonishment}, and therefore
261 of an anthropological nature\footnote{This is also what René Thom says
262   in~\cite{Thoma} p. 130  (translated in English):"...the problem is not to describe reality, the problem is much more to identify in it
263 what makes sense to us, what is surprising in all the facts. If the
264 facts do not surprise us, they do not bring any new element to the
265 understanding of the universe: we might as well ignore them" and
266 further on: "...which is not possible if we do not already have a
267 theory" }, in the face of the small number of counter-examples
268   compared to those expected in the theory.
269   
270   
271
272 Here is an illustration of its subjective nature (of common sense) and
273 its relationship to the workforce at stake in the experience:
274 \begin{itemize}
275 \item on a set of 10 individuals, attributes $a$ and $b$ are checked
276   respectively 6 and 8 times, without counter-example to the rule "if
277   $a$ then $b$". This is logically acceptable; the frequency of b
278   knowing a is 1,
279 \item on a set of 1,000 individuals, attributes $c$ and $d$ are
280   verified respectively 600 and 800 times, with only one
281   counter-example to the rule "if $c$ then $d$". The logical rule is
282   no longer acceptable since the frequency of $d$ knowing $c$ is no
283   longer equal to 1.
284 \end{itemize}
285
286 Which one would surprise you?
287 To which would you give the best predictive quality?
288 In the first case, the rule is strict but confidence in it is
289 fragile.
290 In the second case, it is the opposite, the astonishment is greater
291 despite the lower value of the conditional frequency.
292 This paradox relating to the acceptability of the rule is soluble in
293 subjectivity.
294 SIA will restore an objective component of it.
295 It can be noted that the {\bf statistical concept of confidence} of the
296 association rule $a\Rightarrow b$ (ratio of the frequency of $b$
297 knowing $a$) does not coincide with the {\bf psychological
298   confidence}\footnote{Shapin in~\cite{Shapin} quote J. Locke "Before
299   approving or disapproving [trust], the mind determined to proceed rationally must consider all the motives of probability and see how they orient themselves, more or less in favour of or against a given proposal; and, by balancing the whole, reject or accept it with more or less firm agreement, i. e. on the predominance of one or other motive of probability on either side"} just
300 mentioned, which weakens, if not somewhat discredits, the data mining
301 methods based on the statistical acceptance of confidence.
302 We will come back to this in the discussion of some of these methods
303 (Chapter 2).
304
305 Certainly, the intensity of implication is all the closer to 1 as the
306 perceived quality of involvement is high.
307 The relationship it establishes between variables is frequently
308 expressed in terms of causality.
309 But this causal explicability of a variable by one or more others
310 (J.-M. Levy Leblond speaks of a "{\bf causal field}" in "Aux contraires")
311 that the intensity of implication evaluates, is in no way
312 {\bf deterministic}, it just brings {\bf predictability}.
313 Moreover, it is not {\bf transitive} as we later formalised by the study of
314 {\bf exception rules} where the rules $a \Rightarrow b$ and $b \Rightarrow
315 c$ are not accompanied by the rule $a\Rightarrow c$ or if
316 $a\Rightarrow c$ and $b\Rightarrow c$, the conjunction $a$ and $b$
317 does not imply $c$. Nor is it a matter of {\bf probabilistic determinism} as
318 it is often misinterpreted: if 0.95 is an intensity of implication of
319 $a$ over $b$, this does not mean that $b$ is achieved with the
320 probability 0.95 if $a$ is achieved.
321
322
323 Thus, starting from the search for strict rules, respecting Platonic
324 logic, Régis traded and looked for quasi-rules, no longer respecting
325 formal logic because of its counter-examples.
326 This approach illustrates -- we will return to it -- the way of
327 thinking that we call dialectical\footnote{Régis would like to
328   quote~\cite{Seve}: "...dialectic only comes into play to examine and solve logical difficulties at a higher level"} because it accepts contradictions
329 ("the improbability of the false") and integrates them pragmatically,
330 while enriching knowledge.
331 We will return to this point in Chapter 13 by examining the specific
332 nature of the SIA as formalizing a logic of everyday life into a
333 so-called paracoherent logic.
334 This one, stripped of the Aristotelian non-contradiction, nevertheless
335 makes it possible to provide a formal tool of thought making {\bf
336 the
337 contingent  necessary}.
338 This approach is similar to that of Greek Sophists (5th to 4th centuries A.D.) as we will see in chapter 13 of this book. 
339
340
341 Suppose, therefore, that the intensity of implication for each pair of
342 variables in the experimental situation is calculated.
343 Of course, only the one relating to the couple leading to the greatest
344 intensity of implication is retained for each pair.
345 What to do with the table of all these values?
346 How can we identify the main lines of force that would structure them,
347 as a factorial experiment does?
348 Having a set of evaluated binary relationships, Régis chose to
349 represent it by a weighted and non-cyclical oriented graph, an image
350 more easily apprehensible by the expert user of the field, for example
351 didactics in its evaluation component, psychology, sociology,
352 medicine, etc.
353 In general, it is not reduced to a linear path since several "effects"
354 can be associated with the same "cause" and an "effect" can be the
355 result of several "causes".
356 The problem of ontology representation is then compatible with this
357 framework (work in collaboration with Jérôme David~\cite{Davida}).
358 The following graph, called the implicative graph (Fig.~\ref{chap1fig1}), illustrates this situation. 
359
360 \begin{figure}[htbp]
361   \centering
362 \includegraphics[scale=1]{chap1fig1}
363  \caption{An example of implicative graph}
364 \label{chap1fig1}       % Give a unique label
365 \end{figure}
366
367
368 The edge $c \rightarrow a$ represents the rule\footnote{
369      From now on, "rules" will mean both strict rules and
370      quasi-rules. We will only specify when there may be ambiguity or
371      to emphasize the specificity of quality.} "if the variable $c$ is
372 chosen then generally the variable $a$ is also" i.e. $c \Rightarrow
373 a$.
374 Similarly, the chain $e \rightarrow c \rightarrow a$ is an implicative
375 path.
376 The expert then analyses and interprets the different paths in
377 conceptual terms by giving meaning in his field of expertise to paths
378 in the graph, to networks of paths as Marc Bailleul (ESPE\footnote{in
379   French Ecole Supérieure du Professorat et de l’Education, in English
380 it can be translated in Higher School for Professor and Education.} of Caen)
381 says, to an ascending-descending cone of a variable to the role of
382 attractor that it plays (Fig.~\ref{chap1fig2} and~\ref{chap1fig3}), but also to the connections or their
383 absence.
384 The graph relating to the questionnaire constructed according to cognitive taxonomy has almost validated it by generally, and therefore not always, organizing in the expected preorder the 5 classes and the 20 or so subclasses of this taxonomy (see Chapter 2). 
385
386
387 Here are two other examples of implicative graphs where the colors of
388 the edges are associated with different levels of intensity of
389 implication.
390 Here, red edges mean a higher quality of implication than blue edges and themselves than green edges. 
391
392 \begin{figure}[htbp]
393   \centering
394 \includegraphics[scale=0.4]{chap1fig2}
395  \caption{A second example of an implicative graph}
396 \label{chap1fig2}       % Give a unique label
397 \end{figure}
398
399
400
401 \begin{figure}[htbp]
402   \centering
403 \includegraphics[scale=0.6]{chap1fig3}
404  \caption{An example of an implicative graph with the mode cone}
405 \label{chap1fig3}       % Give a unique label
406 \end{figure}
407
408
409
410 Let us go further. In child development psychology according to
411 Piaget, the notion of reflective abstraction describes the passage
412 from a level of conceptualization to a higher level, each level
413 consisting of rules about objects, then operations on these objects,
414 then operations on these operations, etc... (e. g. diagrams,
415 procedures, design, method,...).
416 We find, moreover, in Darwinian theory of evolution, but also in any
417 mathematical theory, these same expansions when we move from a theorem
418 to a corollary such as, for example, in the study of functions to
419 that, in functional analysis, of function functions.
420 Hence the idea of building a second plan of implicit relations, that
421 of rules of rules according to a hierarchy called cohesive because of
422 the so-called cohesion index which makes it possible to generate
423 classes oriented by such rules.
424 Like some data analysis methods, the interest of moving, non-linearly,
425 from the relational level to the hierarchy level appeared to Regis and
426 his team therefore extended their work for rules to rules of rules or
427 meta-rules or generalized rules.
428
429 \begin{figure}[htbp]
430   \centering
431 \includegraphics[scale=0.5]{chap1fig4}
432  \caption{Oriented hierarchy graph}
433 \label{chap1fig4}       % Give a unique label
434 \end{figure}
435
436
437
438 The rule, illustrated in Fig.~\ref{chap1fig4}, can be expressed by the sentence: the
439 "theorem" generally results in the "theorem".
440 For example, from behavioural theorems, we can identify a trait or a
441 conception (e.g. Dominique Lahanier-Reuter's~\cite{Lahanierb} conceptions of chance).
442 A statistical index, cohesion, also makes it possible to identify the
443 hierarchical levels corresponding to the statistical significance of
444 the classes formed at these levels (in red in Fig.~\ref{chap1fig5}).
445 We construct and detail the mathematical model that underlies the
446 cohesive hierarchy in Chapter 3.
447
448
449 \begin{figure}[htbp]
450   \centering
451 \includegraphics[scale=0.3]{chap1fig5}
452  \caption{Another oriented hierarchy graph}
453 \label{chap1fig5}       % Give a unique label
454 \end{figure}
455
456
457 \section{A detour into the philosophy of science}
458
459 Through these two types of representations of simple rules and then
460 generalized rules, which reveal two types of structures in all
461 variables, we respond to the structuralist philosophy which considers
462 that the "whole" is richer than the sum of its "parts".
463 Régis quotes, on this subject, two excerpts from L. Sève's book
464 (p. 58, translated in English)"...the whole consists of nothing other
465 than its parts, and yet it presents, as a whole, properties that do
466 not belong to any of its parts.
467 In other words, in the non-additive, non-linear passage of the parts
468 to the whole, there are properties that are in no way precontained in
469 the parts and therefore cannot be explained by them" and to continue
470 "Everything happens as if a spontaneous generation of properties of
471 the whole occurs... This is the paradox of the emergence".
472
473
474 Régis insists on this specific property of the SIA where the
475 cohesive hierarchy satisfies in an original way through the extension
476 of relationships between variables.
477 It is through a qualitative leap, generally produced by a threshold
478 effect in quantity (e.g. group psychology, water vaporization, etc.),
479 that everything, at the cost of a synthesis, makes sense.
480 This is extracted from the truly dialectical reading of the {\bf non-linear
481 all/part ratio}\footnote{Régis would like to add that "as shown by the
482   non-linear differential equations of the fundamental index with
483   respect to the cardinal parameters of the observations, unlike what
484   is observable with other competing indices". He also would like to quote K. Mark~\cite{Marx} 
485 "Society is not made up of individuals, but expresses the sum of the
486   relationships, the relationships in which these individuals are
487   situated in relation to each other". And finally we would like to
488   add that "A street is not the sum of the houses in it. Likewise a city is not the sum of its streets, etc."} (non-proportionality and non-additivity of the cause on
489 the effect).
490 With the SIA, there is then a paradox between opposites, link and
491 absence of link, because the whole, constituted (one should say
492 organized) of parts in a dynamic system, has properties that the parts
493 do not possess and which are generally of higher level.
494 In the same way, and metaphorically, in linguistics, the meaning of a
495 sentence is not determined by the analysis of each of its words but by
496 their interaction\footnote{Régis Gras would like to
497   quote~\cite{Gaudin} "There is neither additivity nor proportionality
498   between the meaning of the units (words) and that of the
499   sentence. We see a topology of meaning emerging" and "... the
500   isolated word of the Chinese language has in truth neither meaning
501   nor existence apart, each one receives its meaning only from the
502   word itself (from intonation, etc....), taken in isolation it has
503   ten, even forty meanings,...; if we subtract this word from the
504   totality, it gets lost in a hollow infinity. " from~\cite{Schelling}.}.
505
506
507 The logic behind this all/parts relationship is dialectical (and not
508 dichotomous) because it interactively reconciles contradictions: rule
509 and non-rule, instability of a dynamic system and structural
510 stability.
511 It is based on the importance of the rarity of the counter-example and
512 on the negation of entropy, disorder in the couple rule and non-rule.
513 In this respect, dialectical logic is opposed to strict logic (of the
514 mathematician) without, of course, being a paradox.
515 The fertility and originality of the SIA are due to this character,
516 particularly in the hierarchical analysis, which is clearly non-linear
517 and where the whole is based on its meaning, not by adding the
518 properties of its parts (subclasses) but by synthesizing the
519 inferential interactions.
520
521 It is through the notion of {\bf significant level} that we can highlight
522 the phenomenon of {\bf emerging property}.
523 In this sense, the SIA appears as a kind of avatar of non-linear
524 knowledge learning, learning made of ruptures and dialectical
525 reconstruction (e.g. the epistemology of G. Bachelard or Lev Vygotsky
526 and Chapter 10 on conceptualization). Régis will come back to these
527 properties of the SIA in the chapter devoted to paracoherent logic
528 (chapter 13).
529 In contrast to SIA, the all-part ratio would be {\bf linear} in the case
530 of nesting classes as in clustering based on similarity up to its
531 terminal node.
532
533
534
535
536 From the first applications, in the didactics of mathematics and on
537 human management problems, it appeared that the first index, the
538 implication intensity, had a problem in its discrimination when the
539 number of subjects increased.
540 Hence the need, for this reason and to get as close as possible to the
541 causal interpretation of the rules, to integrate into this intensity
542 the information provided by the {\bf contraposed of implication}.
543 Thus, not only will the measurement of implication take into account
544 the relationship "if $a$ then generally $b$" but also, dialectically,
545 its counterpart "{\bf if not $b$ then generally no $a$}"\footnote{ In
546   everyday life and in most scientific approaches, the causal
547   relationship between "cause $\rightarrow$ effect" is reinforced by observation "if no effect then no cause". This is how a so-called negative experiment is carried out, in which a presumed cause is removed in order to deduce from the lack of effect what is missing for it to occur. }.
548 This new index is based on the notion of entropy, therefore
549 information of experiences evaluating the two rules.
550 This choice allows for more in-depth action to access "knowledge
551 nuggets", rules that would be rejected or ignored by a method based on
552 support and trust (the Agrawal algorithm \emph{a priori}~\cite{Agrawal} seems to be
553 linear thinking).
554 In Chapter 2, we will come back to another way of integrating
555 intensity of involvement and trust while taking into account the
556 contraposition.
557 A brief aside: these different challenges to a system in formalized
558 equilibrium, these readjustments, without questioning the fundamental
559 philosophy, are always frustrating, even irritating for the researcher
560 who must revisit his work.
561 But isn't that what is expected of a scientist if not an attitude that
562 leaves room for doubt, while demanding modesty, honesty and
563 obstinacy.
564
565 Although we seek relationships between variables through non-symmetric
566 rules and these relationships can often be expressed in terms of
567 causality, we do not claim, as Régis said earlier, that they are
568 deterministic, but simply that they have the ability to allow
569 quantifiable assumptions to be made about their predictability.
570
571
572 \section{A software for SIA}
573
574
575 When the number of subjects and variables increases, it is difficult
576 to perform the associated calculations and especially to provide the
577 two representations: graph and hierarchy.
578 At first, both tasks were done by hand. Régis did it for his thesis
579 with obstinacy in order to represent the links between 40 variables.
580 Then, he wrote a first program in the Basic language that performed
581 the calculations and built the {\bf hierarchy}.
582 Imagine the excitement of the novice programmer that Régis was to see
583 a hierarchy develop before his eyes, where the levels did not
584 overlap.
585 A doctoral student from I.C. Lerman -H.Rostam- in his turn built the
586 {\bf implicative graph} using a more sophisticated program whose algorithm
587 Régis had developed.
588 Then, two of my doctoral students, Saddo Ag Almouloud~\cite{AgAlmouloud} and Harrisson
589 Ratsimba-Rajohn~\cite{Ratsimba}, integrated the whole into a single software that we
590 called {\bf Implicative Cohesive Hierarchy Classification} under the
591 sympathetic acronym "{\bf C.H.I.C.}", called CHIC in the following. The acronym was chosen from the French
592 meaning, in English the meaning is more debatable.
593 Finally, since the late 1990s, Raphaël Couturier~\cite{Couturiera} has unified the
594 complete processing of calculations and representations while
595 continuously improving it due to the development of the underlying
596 theory and the variety of applications.
597 In particular, a CHIC option makes it possible to show the different
598 possible predictors and descendants of a variable, but also to
599 determine the optimal conjunction of these in the sense of their
600 originality.
601 The possibility of modifying the construction threshold of the
602 implicit graph highlights the plasticity of the structure of all the
603 variables, while dialectically reconciling the instability of a
604 dynamic system with its structural stability.
605 A first version written in R was presented by Raphaël Couturier at the
606 ASI 8 symposium (Radès, Tunisia, November 2015), then in a more
607 advanced state at the ASI 9 symposium (Belfort, France, October 2017).
608
609
610 This software is operational throughout the world since 26 countries,
611 mostly Greek-Latin, own and use it\footnote{ Currently, Pablo Gregori (Castellon) and Ruben Rodriguez (Riobamba) are working with Raphaël Couturier to translate CHIC into an open computer version under R.}.
612 For research, as we can understand, it plays the dual role of
613 {\bf developer and analyzer}.
614 We will come back to these properties later.
615 As a result, questions about the possibilities and limitations of ASI
616 are emerging through general but also specific questions due to
617 different traditions and cultures.
618 In addition to the letter-writing link, they are strengthened through
619 our international meetings on ASI, from ASI 1 (Caen) to ASI 7 (Sao
620 Paulo) in 2013 and recently in 2015 in Tunisia and 2017 in Belfort.
621 These are the questions that drive the theory and its tool towards
622 continuous developments as we will see.
623 To illustrate this, Régis will quote Anne Lauvergeon~\cite{Lauvergeon} "... when you produce,
624 you also end up conceiving".
625 Or as H. Atlan~\cite{Atlanb} (p. 110) writes  "...using beliefs first as
626 practices can be more effective than focusing immediately on
627 theoretical beliefs, explained in statements, which are already
628 supposed to take the place of certain knowledge...".
629
630
631 \section{Extension of the method to other variables}
632
633 It is therefore through the different situations encountered that the
634 limitation to binary variables, which served to give a set meaning to
635 involvement, appeared constraining.
636 The one who fired the first was Marc Bailleul~\cite{Bailleula} who wanted to look for
637 ordered preference relationships between teachers' assertions.
638 {\bf Modal variables} ("a little", "a lot", "not at all",...) had to be
639 processed.
640 He proposed a first index satisfying the expression measure of the
641 type: "{\bf if for a the modality "a little" is chosen then generally for b
642 a modality greater than or equal to this one is chosen}".
643 In his thesis, Marc Bailleul obtained excellent results, some of which
644 were unpredictable, with regard to 4 conceptions of mathematics
645 teaching as seen by professors.
646 We have used his study in several papers and in some chapters of the
647 Proceedings of our various symposia on ASI.
648
649
650 In order to proceed, with regard to the same problem, by extending the
651 intensity of involvement between Boolean variables, with
652 J.-B. Lagrange~\cite{Lagrange}, we then defined a new measure relating to {\bf
653   numerical variables} making it possible to assign a value to
654 statements such as: "{\bf if $a = \alpha$ then generally $b \ge
655   \beta$}". Jean-Claude Régnier~\cite{Regniera}, for his part, reduced the problem of
656 the search for relationships between preferences to that of {\bf rank
657   variables}, which provided another extension of the SIA.
658
659 From there, following a question from E. Diday placed within the
660 framework of {\bf symbolic variables} and by an extension of numerical
661 variables, we assigned values to expressions "{\bf if $a$ takes its
662   values in the interval $I_a$ then generally $b$ takes its values in
663   $I_b$}".
664 The main idea was to partition the range of values taken by each
665 variable into sub-intervals maximizing their inter-class variance.
666 The interest of this new category of variables, called {\bf
667   intervals}, was manifested in teaching, in comparing performance
668 hierarchically in different disciplines and in seeking to transfer
669 specific skills to other skills.
670
671
672 We then see that of these {\bf interval variables} treated in
673 collaboration with E. Diday and Pascale Kuntz~\cite{Grasj}, we naturally arrive at
674 {\bf fuzzy variables} as we find them in the study of relationships of
675 the type: "if the tension $a$ of a subject is rather high then
676 generally his heart rate $b$ is too".
677 We anticipate the practical applications that can result from this in
678 construction problems or failure detection.
679 Thanks to the collaboration of Fabrice Guillet, Maurice Bernardet,
680 Raphaël Couturier, Filippo Spagnolo, this allowed Régis to model the
681 notion of fuzzy variable in the context of interval variables and to
682 make a presentation at a conference on fuzzy logic~\cite{Spagnolo}.
683
684 A problem occurred one day in the implication processing of too large
685 a set of variables to the point of making the resulting graphs
686 unreadable. With Fabrice Guillet and Robin Gras~\cite{Grask}, we defined an
687 equivalence relationship between the variables, based on their
688 neighbouring implicit behaviours, which led to the substitution of a
689 leading representative of this package for a package of variables.
690 This {\bf reduction} has proved effective in many other situations, for
691 example in Laurence Ndong's thesis~\cite{Ndonga}.
692
693 A little stop to talk about the collaborations in the DUKe team, to
694  which Régis belongs in the Laboratory of Digital Sciences of Nantes
695  (LS2N), collaborations always based on epistemological choices in
696  response to semantic expectations.
697 The explosion of a multitude of application or theoretical questions,
698 still not symmetrical, has led to joint work undertaken since 1990
699 with some members of the DUKe team: Régis will mention for example,
700 with Pascale Kuntz~\cite{Graso} on {\bf rule hierarchies} (ah! the demonstration of the
701 ultrametric of the hierarchy! the algebraic model of hierarchy !),
702 on {\bf exception rules} with Einoshin Suzuki~\cite{Grasr}, {\bf rule redundancy} still with
703 Pascale, with Julien Blanchard on {\bf entropic analysis}, {\bf temporal
704 variables, gene expression in bioinformatics} with Gérard Ramstein~\cite{Ramstein},
705 etc...
706
707 For example, how did the need for time variables become apparent?
708 Well, to account for the changing relationships between economic,
709 social or cognitive variables.
710 Indeed, can we explain in teaching, the involvement between variables
711 when we proceed to interventions during the year on learning or in
712 socio-psychology by successive interventions, by interviews or by
713 internships (in collaboration with D. Pasquier)?
714 We then formalized these time-indexed variables into {\bf vector variables},
715 where a variable is modeled by a time-set vector.
716 Then, Julien Blanchard, in collaboration with Fabrice Guillet and
717 Régis, defined {\bf sequential variables} modelled by a Poisson process in a
718 different way.
719 So many new concepts and new fields of application born of various
720 problems and expected extensions.
721
722 {\bf Generalized extensions} of the SIA have recently been introduced:
723 \begin{itemize}
724   \item
725 On the one hand, to a continuous set of subjects, for example colours,
726 opinions, with a given distribution law, generalization since until
727 then the model was limited to discrete and finite sets;
728 \item
729 On the other hand, to all the values of different types of variables, taken in continuous spaces, for example fields, with given laws;
730 \item
731   Finally, in this book, we present an extension to continuous variables, which represents a major theoretical advance in data analysis.
732 \end{itemize}
733
734 Régis insists on a remark likely to satisfy any Cartesian mind: during
735 each extension (nature of the variables, structure of the subject and
736 variable spaces), we have tried to prove and we believe that {\bf the
737 restriction to the fundamental case of binary variables and discrete
738 spaces was always satisfied}.
739 The mathematical interlocking is original and rigorous.
740
741
742 \section{Explanatory role of additional variables}
743
744 Another question bothered Régis very early on.
745 Is there an internal structure in the population of subjects involved
746 in a study that would explain the variable structure revealed by the
747 ASI?
748 Assuming an implicit variable structure obtained by a graph or
749 hierarchy, is it possible to designate the subjects and categories of
750 subjects more or less responsible for the elements of these
751 structures?
752 For example, if we observe that in all school classes a certain
753 conception of geometric notions leads to certain response behaviours,
754 to which type of pupils, to which type of didactic variable, to which
755 context can it be more specifically attributed?
756 Conversely, which students would be resistant to it?
757 With the theses of Harrisson Ratsimba-Rajohn and Marc Bailleul, we
758 have formalized and exploited, in the SIA, the notion of the
759 additional variable (or {\bf exogenous} as opposed to the {\bf endogenous}
760 variables analysed) and its {\bf contribution} (we also speak of {\bf typicality})
761 to structural elements, {\bf networks} or hierarchical classes of rules for
762 example, semantically explained during a previous analysis.
763 Even better, we were able to retroactively define a {\bf dual topological
764 structure} on all subjects.
765 Thus, for example, an "emblematic conception of the republican school"
766 is reinforced in a privileged school environment where the distance
767 inferred between pupils by an element of the rule structures is the
768 lowest (work with Dominique Lahanier-Reuter. 
769
770 But since Régis have cited throughout the pages the contributions and
771 the role of collaborators as spurs for the development of SIA, he must
772 highlight the critical, scratchy but constructive role that
773 Jean-Claude Régnier plays both with regard to theory and its
774 applications and with regard to dissemination, the popularization of
775 SIA since he has taken over the presidency of the international SIA
776 events.
777 How many slips of the tongue, mistakes, clumsiness, excessive haste on
778 my part, Pascale Kuntz and Jean-Claude Régnier have straightened it
779 out! Nor do Régis forget the faithful dedication and computer skills
780 of Raphaël Couturier, without whom the SIA, deprived of CHIC, and now
781 of RCHIC, would only be a theoretical and perhaps speculative
782 construction to contemplate.
783 He has overcome, with CHIC, Régis' handicap in computer science as
784 Pascale Kuntz has kindly done for English.
785 I am also concerned that this last failure has cost the ASI a better
786 international audience.
787 However, other international teams are also involved in the
788 development and application work of the SIA using CHIC software.
789 Régis quote, in particular, given their regularity of participation:
790 \begin{itemize}
791 \item 
792 actively led by Pilar Orus (University of Castellon in Spain), a
793 diversity of Hispanic nuclei in Spain (Pablo Gregori, Eduardo Lacasta,
794 Miguel Wilhelmi, ...), Cuba (Larisa Zamora,...), Chile
795 (Guzman-Retamal,...); Argentina (Pablo Carranza,...), Ecuador (Ruben
796 Pazmiño) have created permanent links;
797 \item in Italy, the recently deceased Filippo Spagnolo had created a
798   team that is now closing in on Benedetto Di Paola;
799 \item in Brazil, around Saddo Ag Almouloud, Vladimir Andrade and
800     thanks to the strengthening provided by agreements with
801     Jean-Claude Régnier and Lyon II University;
802 \item in Cyprus around Athanasios Gagatsis, in Slovakia with Lucia
803   Rumanova,
804 \item more episodically, researchers from Belgium, Switzerland,
805   Germany, Greece, Romania, Czech Republic, Japan, Vietnam, Canada,
806   Mexico, Argentina, Gabon, Tunisia, Algeria; and Régis
807   forget, use SIA's method and tool.
808 \end{itemize}
809
810
811 \section{Specificities of the SIA and conclusion}
812 SIA compared and measured with other data analysis methods, has
813 important original characteristics. Régis summarize them:  
814 \begin{itemize}
815 \item
816  the {\bf successive models} of variables responding to explicit
817  epistemological constraints compatible with the semantics of the
818  situations to be modeled;
819 \item
820   the {\bf asymmetry} of the method;
821 \item
822 the progressive {\bf extension} of the nature of the treated variables while
823 maintaining the extension properties;
824 \item
825 the {\bf pedagogical and ergonomic capacities} of the representations of two
826 structures on all variables: a graph for the rules, a hierarchy for
827 the generalized rules;
828 \item
829 the {\bf structural duality} of the two spaces at stake: subjects and
830 variables with the notions of contribution and typicality to the
831 structures;
832 \item 
833 the {\bf extension of the finite discrete to continuous} for both variables
834 and subjects;
835 \item
836 the {\bf originality of the dialectical reasoning} underlying the definition
837 of simple and generalized rules;
838 \item 
839 the {\bf simplicity of the underlying mathematical model} ensuring
840 accessibility, plasticity and fertility useful to meet application
841 expectations in a wide range of fields.
842 \end{itemize}
843
844 Some may say that SIA, by the amplitude of its fields of application,
845 by the homogeneity of its analytical and graphic properties, presents
846 an original {\bf paradigmatic nature}.
847 Should we recognize him? Djamel Zighed, Director of Digital at the
848 Agence Universitaire de la Francophonie, expresses this idea as
849 follows: "The SIA is not a method but a broad theoretical framework in
850 which modern problems of knowledge extraction from data are
851 addressed. It is a general theory in the field of causality because it
852 responds to weaknesses in other theories, it provides formal tools and
853 practical problem-solving methods. Its applications are multiple... ».
854 Régis would add that SIA represents a true philosophical mode of
855 thought since, as its title says, it draws its source from the
856 improbability of errors, the improbability of the false, to establish
857 the bridge that allows us to overcome contingency and lead to
858 necessity.
859