Annexes
 
Méthodologie
Méthodologie des essais thérapeutiques :

Méthodologie des essais thérapeutiques

Par Gilles Bouvenot* et Bernard Régnier**
*Professeur, laboratoire de méthodologie des essais cliniques, faculté de médecine de Marseille ; Inserm U 21, Recherches cliniques et épidémiologiques, Villejuif.
**Professeur, clinique de réanimation des maladies infectieuses,
groupe hospitalier Bichat-Claude-Bernard, Paris.

Référence : Répertoire des essais thérapeutiques en France VIH et sida, (Arcat-sida) édition 1992.

C'est à la suite d'un long et difficile parcours d'obstacles qu'une substance chimique, porteuse d'un projet thérapeutique, peut obtenir du ministre compétent son autorisation de mise sur le marché (AMM), après avis de la commission d'AMM.
Il faut en général sept à douze années pour que, de l'idée d'un principe actif, on puisse aboutir à sa commercialisation. Par rapport au nombre de partants, très rares sont ceux qui franchissent la ligne d'arrivée. Durant ce laps de temps, se déroule une succession d'étapes obligées qui visent à l'évaluation de la sécurité et de l'efficacité du produit. Ces contraintes n'ont pas, en effet, d'autre but que de protéger le patient — futur bénéficiaire du futur médicament — et de lui garantir un rapport potentiel bénéfice/risque satisfaisant.
Certaines innovations, notamment en matière méthodologique, ont permis de réduire sensiblement ce délai. Cela s'applique en particulier aux situations qui, compte tenu de leur gravité et de l'absence de thérapeutique, constituent des urgences. L'infection par le VIH en est une. Néanmoins, ces évolutions méthodologiques n'ont pas entraîné de bouleversement du schéma général de développement d'un médicament tel qu'il a été progressivement défini ces dernières années.
L'étape initiale correspond à la sélection, lors d'expérimentations in vitro, d'une molécule potentiellement active. Selon le type d'activité envisagé, différents modèles sont utilisés. En ce qui concerne la sélection d'un antirétroviral, elle peut être réalisée en étudiant son activité sur une culture cellulaire propre à la réplication du VIH. D'autres modèles expérimentaux peuvent permettre d'obtenir certaines indications sur la toxicité de la molécule, mais ces informations sont encore, à ce stade, des études très préliminaires.
Une fois ces données recueillies, deux grandes périodes se succèdent dans le développement d'un médicament : la période d'expérimentation chez l'animal qui complète l'étude préclinique (dite des pré-requis) puis la période d'étude clinique qui correspond aux différentes phases d'expérimentation chez l'homme.

Période d'étude chez l'animal

Cette période d'expérimentation sur l'animal est un préalable indispensable à toute administration du produit à l'homme. Elle permet, en effet, d'arrêter dès ce stade précoce le développement des molécules que l'on peut, du fait de leur importante toxicité chez l'animal, prévoir comme dangereuses pour l'homme ; dans les autres cas, elles indiquent les types de surveillance à exercer plus particulièrement lors de l'administration ultérieure du produit à l'homme. Elle correspond à un ensemble d'études portant sur les conditions de sécurité et d'efficacité dans l'utilisation de cette substance.
Il faut préciser qu'il n'existe pas de modèle animal de l'infection par le VIH qui soit véritablement représentatif et que, dans ce domaine,
il faut aller au-delà de la prudence, classique, lors de toute extrapolation à l'homme des résultats
obtenus durant cette période d'étude. Cette
carence touche particulièrement l'évaluation des thérapeutiques antirétrovirales. En revanche de bons modèles animaux existent pour certaines infections opportunistes notamment la toxoplasmose, la pneumocystose pulmonaire et la cryptococcose.
Des études de galénique définissant des formes utilisables chez l'animal, et plus tard chez l'homme, et des études de stabilité (recherche de dégradation de la substance lors du vieillissement) sont programmées.

Conditions de sécurité

Ces conditions sont définies par les études toxicologiques. Les études de toxicité aiguë visent à déterminer les doses toxiques chez l'animal et les organes souffrant électivement de cette toxicité. Elles sont pratiquées chez au moins deux espèces de mammifères (dont un non rongeur), avec deux voies d'administration, dont l'une est identique à la voie qui sera préconisée en thérapeutique humaine. Divers lots d'animaux des deux sexes reçoivent ainsi des doses du produit étudié, en administration unique, et sont surveillés durant au moins quatorze jours. Pour de nombreux produits, d'autres mammifères sont étudiés en petites séries, en particulier le lapin, le chien, voire le chat ou le singe (avec mesures physiologiques continues : enregistrements hémodynamiques divers, électrocardiogramme, électro-encéphalogramme...). Tous les résultats sont rapportés au poids de l'animal, afin de définir des toxicités " par kilogramme " ou " par 100 grammes de poids ". Il existe une correspondance stricte entre la durée de ces études et la durée des études ultérieurement envisageables chez l'homme. Par exemple, pour un essai d'administration du produit pendant trois mois chez l'homme, il faut que les études de toxicité chez l'animal aient duré au moins six mois.
Les études de toxicité en administration réitérée, toxicité subaiguë et chronique (trois mois et plus) " ont pour objet de mettre en évidence les altérations fonctionnelles et/ou anatomopathologiques consécutives aux administrations répétées de la substance active ou de l'association des substances actives et d'établir les conditions de l'apparition de ces altérations en fonction de la posologie " (directive 75/318 CEE). Elles permettent de déterminer les organes cibles et les fonctions cibles du produit administré, en fonction de la dose, du temps, de la voie d'administration, de l'espèce et du sexe.
Les études de la reproduction comportent au moins trois recherches :

  • l'étude de fertilité avec administration du
    produit étudié à des lots d'animaux mâles et
    femelles avant l'accouplement ;

  • l'étude de l'embryogenèse avec administration du produit à des lots de femelles en gestation ;

  • l'étude de la périnatalité avec administration du produit en fin de gestation ou durant la lactation.
    Les études de mutagenèse recherchent les modifications du matériel génétique induites par
    le médicament (qui indiqueraient un risque génétique potentiel de cancer pour la génération
    actuelle).
    Les études de cancérogenèse comportent le
    relevé systématique des tumeurs sur des lots d'animaux recevant le produit durant une grande partie de leur vie (par exemple 104 semaines chez la souris). Elles s'imposent, en particulier, lorsque le produit est susceptible d'être administré régulièrement pendant une période minimale
    de six mois, ou fréquemment, de façon inter-
    mittente. La longueur de certaines études explique que pour des molécules proposées dans des maladies graves - sans alternative thérapeutique -, les essais chez l'homme puissent débuter avant d'en connaître les résultats définitifs.

Conditions d'efficacité

Les études pharmacodynamiques visent à définir l'effet principal du produit (dose efficace, type et durée de l'effet sur l'organe isolé ou dans différentes espèces animales), son mécanisme (mise en jeu de médiateurs, de récepteurs...), ses effets secondaires (dits indésirables lorsqu'ils sont nocifs) et les doses relatives entraînant effet principal et effets secondaires.
Les études pharmacocinétiques animales déterminent les conditions d'absorption, de distribution et d'élimination du produit, et son métabolisme dans l'espèce concernée.

Période d'étude chez l'homme

Le passage à l'homme est entrepris lorsque, au vu des résultats de l'étude préclinique, il est possible d'espérer, pour le produit, un effet thérapeutique, une sécurité d'emploi et aussi un développement commercial intéressant.
Les conditions d'étude des médicaments chez l'homme sont définies en France par la loi n° 88-138 du 20 décembre 1988 (dite loi Huriet-Sérusclat) relative à la protection des personnes qui se prêtent à des recherches biomédicales. Elle précise les modalités d'information, de recueil du consentement de ces personnes et la nécessité de soumission des protocoles d'essai à l'avis d'un " Comité consultatif de protection des personnes qui se prêtent à des recherches biomédicales ". Les études chez l'homme sont schématiquement et classiquement divisées en quatre phases. Une contraction de ces différentes phases peut, dans certaines circonstances, être réalisée permettant ainsi de gagner du temps.

Phase I

La phase I correspond à l'étude de la première d'administration de la substance à l'homme. Elle doit être réalisée dans des centres de pharmacologie clinique agréés, dotés d‘un matériel
performant et de personnels spécialisés et expérimentés. On y étudie la tolérance biologique et clinique du produit, son devenir dans l'organisme, et l'on détermine la plage des doses susceptibles d'être utilisée par la suite pour les essais d'efficacité.
Ces essais de phase I impliquent des volontaires sains, lorsque la toxicité attendue du médicament est limitée. Dans le cas contraire, situation que l'on rencontre fréquemment lors de l'évaluation de traitements antiviraux ou antimitotiques, cette première administration à l'homme est réalisée chez des malades.
C'est donc avant tout une étude de tolérance destinée à déterminer, en particulier, la dose maximale tolérée ; le choix de la dose de départ se fait à partir des données de la toxicologie animale, les doses ultérieures étant progressivement augmentées sous haute surveillance clinique et biologique. C'est aussi une étude de la cinétique du produit. C'est enfin le préalable à la détermination des doses qui seront ultérieurement administrées au malade en phase II.

Phase II

Ces essais ont pour objectif d'étudier l'efficacité pharmacologique du produit. Les essais de phase II précoce poursuivent les études de pharmacocinétique et permettent de déterminer les propriétés pharmacodynamiques. Les essais de phase II tardive vérifient l'hypothèse d'efficacité thérapeutique et précisent les posologies à utiliser lors des essais de phase III (étude de recherche de la dose optimale).
La pharmacologie humaine est étudiée chez des petits groupes de patients (quelques dizaines). Dans l'idéal, l'effet recherché doit être défini par un paramètre précis, stable, de mesure reproductible et ayant une signification médicale. Pour l'infection par le VIH, aucun paramètre ne remplit l'ensemble de ce cahier des charges. En pratique, plusieurs critères sont retenus : cliniques, biologiques, immunologiques (taux de lymphocytes CD4) et, de plus en plus souvent maintenant, virologiques (titrage de l'antigénémie p24, techniques de quantification de la charge virale).
La pharmacocinétique humaine détermine la biodisponibilité du produit (mise à la disposition de l'organisme à partir de la forme galénique retenue), les espaces de diffusion, les conditions d'élimination, le métabolisme et, éventuellement, la pharmacocinétique des métabolites (dont certains peuvent être " actifs "). Ces données sont établies en administration unique, en administration répétée, et en fonction de l'utilisation thérapeutique prévue.
Au terme de cette phase II, il est possible de préciser l'activité du produit, sa sécurité d'emploi à court terme et les doses appropriées pour les essais de phase III. Selon les cas, une relation dose/effet a pu également être définie.
De plus en plus fréquemment, et pas uniquementdans le cas de l'infection par le VIH, des essais de phase I-II sont réalisés, qui ont pour objectif de fournir en un seul essai des éléments de réponse aux questions abordées auparavant séparément dans ces deux phases. Ce sont donc des essais de première administration chez l'homme, permettant d'obtenir des informations sur la tolérance et la pharmacocinétique du produit mais, dans le même temps, ils sont construits de manière à recueillir les premières indications sur son efficacité. Ces essais, fréquents lors de l'évaluation de traitements antirétroviraux, impliquent alors obligatoirement des personnes atteintes par le VIH. Par rapport aux études de phase I " classique ", la durée de l'essai est souvent plus longue (six mois à un an) et le nombre de personnes incluses plus important (50 à 100). Ces essais peuvent être multicentriques mais, dans ce cas, le nombre de centres est restreint.
Le principal avantage de ce type d'essai est le gain de temps qu'il procure pour le développement de la molécule. Néanmoins leurs résultats sont moins précis que ceux des essais de phase II " classique ", notamment concernant l'efficacité, ce qui justifie alors la réalisation d'essais de phase II-III.

La phase III

La phase III se traduit par la réalisation de plusieurs essais dont l'objectif est d'apprécier, s'il existe, l'effet thérapeutique et les effets indésirables les plus fréquents du nouveau produit. Elle doit permettre ainsi l'évaluation à moyen terme du bilan efficacité/sécurité. Elle est par excellence celle des essais comparatifs. C'est à dire que les effets du nouveau produit sont étudiés chez un groupe de patients donné atteints de la maladie à traiter, et qu'ils sont comparés aux effets obtenus chez un groupe comparable de patients (groupe témoin ou groupe contrôle) à qui l'on prescrit soit un traitement de référence (médicament déjà reconnu actif dans cette indication, quand il existe), soit un placebo. L'appartenance à l'un ou l'autre de ces deux groupe est déterminée pour chaque patient par tirage au sort (" randomisation ").
Un placebo est une substance inerte, sans activité pharmacologique, qui a la même apparence (forme, couleur...) que le produit à tester. Sa justification réside dans le fait que l'on sait depuis longtemps que la prise d'un produit " quelconque ", a fortiori quand on a de bonnes raisons de croire à son efficacité, a un effet thérapeutique en dehors de toute activité spécifique. La question qui se pose alors est de savoir dans quelles circonstances un placebo est justifié, et dans quelles autres il n'est pas éthique. Il est clair que, dès lors qu'un traitement de référence existe, il ne serait pas éthique d'avoir recours à ce procédé. Pour les essais comparatifs de nouveaux traitements antirétroviraux, l'AZT, en dehors des situations d'intolérance ou de résistance, constitue un traitement de référence, et l'usage d'un placebo n'est pas licite. En revanche, en ce qui concerne des essais conduits chez des patients séropositifs asymptomatiques sans retentissement immunitaire, la question reste ouverte puisque la nécessité d'un traitement par AZT à ce stade est controversée.
Le but d'un essai contrôlé est la recherche d'une différence entre les résultats des deux groupes comparés. Cette différence doit être non seulement statistiquement significative mais encore cliniquement signifiante et correspondre à une modification positive pour le malade, ayant une signification claire pour le médecin.
Le nombre de patients devant participer à l'étude est calculé en tenant compte de la variabilité du critère de jugement, de la différence attendue entre les résultats des deux traitements comparés et des risques statistiques choisis. Ce calcul garantit en effet la puissance nécessaire à la mise en évidence d'une éventuelle différence entre les deux groupes, donc entre les deux traitements. Les études impliquent souvent la participation de plusieurs centaines voire milliers de patients. A leur terme, l'efficacité du produit peut être démontrée et sa sécurité d'emploi connue dans ses grandes lignes.
Les essais de phase II-III s'apparentent, dans leur méthodologie générale, aux essais de phase III. Ce sont des essais comparatifs, entrepris plus précocement, sur la base de données moins complètes concernant le produit à tester.
La phase III débouche sur une éventuelle autorisation de mise sur le marché (AMM). En effet, si les résultats de ces différents essais sont positifs et si le rapport potentiel bénéfice/risque est globalement favorable pour les patients, la commission d'AMM pourra proposer au ministre chargé de la Santé, l'AMM du produit.

Phase IV

La phase IV vient ensuite, généralement après commercialisation. Elle ne doit pas être confondue avec les études destinées à obtenir une nouvelle indication, ou à définir de nouveaux schémas posologiques. Réalisée dans les conditions habituelles d'emploi,la phase IV permet d'affiner les connaissances sur le médicament, de mieux préciser ses modalités et ses conditions d'utilisation (par exemple dans les groupes de patients à risque) et de le " situer " au sein de l'arsenal thérapeutique parmi les produits d'action comparable. Elle permet de reconnaître les effets secondaires rares ou tardifs qui de ce fait ne peuvent apparaître lors des essais de phase III. Elle est aussi le temps de la pharmacovigilance, dont le rôle est de recueillir le plus d'informations possible sur la tolérance du produit, dès lors qu'il est largement prescrit dans les conditions habituelles, et de proposer des précautions et des limitations d'emploi, voire le retrait du marché s'il est clair que le bilan du médicament n'est pas, en définitive, globalement favorable aux malades.
Les essais réalisés après AMM, mais visant à documenter l'efficacité pour de nouvelles indications ou celle de nouveaux schémas thérapeutiques par rapport à l'AMM sont, par définition, appelés de phase III.
S’il n’est donc pas facile de devenir médicalement, le rester ne l’est certainement pas non plus.

Principe des essais comparatifs

Le bon sens veut qu'un médicament soit efficace dans l'indication qu'il revendique et ne soit pas plus nocif, pour le malade qui le prend, que ne le serait spontanément la maladie. La prescription d'un médicament présuppose donc qu'on a pu apporter la preuve de son efficacité et de sa sécurité d'emploi au regard de l'évolution et de la gravité naturelle de l'affection à traiter, autrement dit que le rapport bénéfice/risque du produit prescrit est globalement favorable au patient. Il ne viendrait, par ailleurs, plus à l'esprit de personne de généraliser à l'ensemble de la population des malades les résultats obtenus avec un certain produit sous prétexte que ce produit a pu, de manière anecdotique, se montrer actif sur un ou deux cas de la maladie, à moins qu'il ne s'agisse de quelques cas de guérison d'une maladie spontanément et constamment mortelle et ne bénéficiant d'aucun autre traitement efficace. L'évaluation du médicament implique donc une méthodologie rigoureuse, en particulier dans le cadre des essais cliniques.
La méthodologie des essais cliniques repose sur les trois principes de com paraison, de causalité et de signification.

" Qui dit évaluationdit comparaison "

C'est par leurs résultats " moyens ", obtenus sur des groupes de patients, que l'on évalue les traitements. Encore faut-il bien se garder d'apprécier ces résultats dans l'absolu. Si l'on observe, par exemple, 60 % de succès dans un groupe de patients atteints de la maladie et traités par le produit, cela ne permet pas de conclure que ce produit puisse être un traitement efficace de la maladie, car les 60 % de succès observés peuvent être aussi bien dus à l'effet du traitement qu'à la régression spontanée de la maladie.
L'évaluation du produit ne saurait donc s'envisager que dans le cadre d'une comparaison avec les résultats moyens observés pour un groupe témoin qui n'a pas reçu le produit en question mais autre chose : un traitement de référence ou un placebo.

La différence est-elle réelle ?

Confronter sommairement les deux pourcentages de succès dans les deux groupes de patients ne suffit pas. Que le taux de guérison dans le groupe " produit à tester " soit de 60 % alors qu'il n'est que de 40 % dans le groupe " témoin " ayant reçu un placebo ne signifie pas pour autant que le taux de guérison du groupe testé soit supérieur. Car la question se pose de savoir si la différence observée (60 % - 40 % = 20 %) traduit une différence entre les probabilités de guérison ou si, au contraire, elle n'est imputable qu'aux seules fluctuations d'échantillonnage du pourcentage de succès que l'on observerait si les deux traitements donnaient des résultats identiques. Il faut donc comparer 60 % à 40 % par un test statistique dont le résultat donne la probabilité d'obtenir, du simple fait du hasard (si les taux de succès par le produit à tester et le placebo ne diffèrent pas dans la réalité), une différence au moins égale à celle observée (60 % - 40 %). Si cette probabilité est égale ou inférieure à 5 % (seuil adopté pour la signification), on dit alors que les deux pourcentages diffèrent significativement au risque 5 % (risque alpha des statisticiens) ; si la différence d'efficacité des deux traitements comparés était nulle, on aurait alors moins de cinq chances sur cent de trouver une différence aussi grande que celle observée (60 % - 40 %). Le test statistique donne une idée, dans l'exemple choisi, du degré d'invraisemblance de l'hypothèse d'égalité des deux traitements.

La différence est-elle imputable au traitement ?

Cependant, à supposer que la différence observée entre les deux groupes soit significative, on ne pourra l'imputer aux effets du traitement que si la comparaison a porté sur deux groupes comparables à tous égards, c'est-à-dire ne différant que par la nature du traitement reçu. Or, la constitution de groupes comparables pour toutes les caractéristiques autres que le traitement reçu, en particulier les facteurs pronostiques, fait appel au tirage au sort (ou randomisation) de l'attribution des traitements et aux procédures d'aveugle.
En effet, outre l'imprévisibilité, l'affectation aléatoire des traitements assure, indépendamment de toute caractéristique des malades, la comparabilité initiale des groupes. Aucune autre méthode — témoins alternés (un malade sur deux reçoit le nouveau traitement, l'autre est témoin), choix de témoins d'une autre époque ou d'un autre hôpital, emploi de la première lettre du patronyme ou de l'année de naissance — n'est scientifiquement ni éthiquement défendable. Elle conduirait à constituer des groupes dont les différences en fin d'étude risqueraient à elles seules d'expliquer les différences finales observées entre les groupes après administration des traitements. Elle produirait des études inutiles, dont les conclusions ne seraient pas crédibles.
Les procédures d'aveugle (ou d'insu) permettent de maintenir la comparabilité des groupes en cours d'étude. Il est essentiel que non seulement le malade (simple aveugle) mais aussi l'équipe soignante (double aveugle) ignorent lequel des deux traitements est pris. En effet, la connaissance par le malade de la nature de son traitement peut modifier son comportement dans un sens différent selon le groupe auquel il appartient, retentir sur son mode de vie (régime...), sur l'observance du traitement, et fausser son propre jugement sur l'effet qu'il ressent : tel le malade qui, sachant qu'il appartient au groupe placebo, aura tendance à minimiser les résultats. De même, la connaissance par le médecin et l'équipe soignante du traitement pris par le malade peut influer sur le cours de la maladie, la qualité des soins, l'écoute et les conseils donnés, la surveillance des effets indésirables et l'évaluation des traitements. Ainsi le double aveugle assure-t-il la meilleure égalité possible du suivi, indépendamment de l'effet des traitements. Il permet également d'assurer que la comparabilité des deux groupes, obtenue grâce au tirage au sort, persiste tout au long du déroulement de l'essai. Par ailleurs, la lecture du critère de jugement, même si ce dernier est objectif, doit se faire à l'aveugle chaque fois que c'est possible, par une personne ignorant la nature des traitements reçus, afin d'assurer l'égalité des conditions de mesure ; et cela à plus forte raison lorsque, pour des motifs pratiques (par exemple de surveillance d'un effet biologique attendu, type anticoagulation ou de survenue d'un effet indésirable spécifique de l'un des deux traitements, type bradycardie), le double aveugle n'est pas réalisable ou sûrement réalisé.
Ainsi, dans le cadre d'un essai comparatif, l'observation d'une différence significative entre les résultats de deux traitements pourra-t-elle être raisonnablement imputée aux effets des traitements étudiés.
S'agissant de la nature comparative des essais, du tirage au sort de l'attribution des traitements et de la conduite des études en aveugle, l'investigateur se doit d'expliquer qu'il s'agit d'exigences scientifiques incontournables, et surtout qu'aucun des deux groupes constitués n'est, a priori, pénalisé ni désavantagé par rapport à l'autre. L'idée et la réalisation d'un essai suppose, en effet, l'existence d'une situation thérapeutique dite d'incertitude, c'est-à-dire " d'équivalence " entre les deux traitements ou les deux modalités thérapeutiques à comparer. Ce n'est guère qu'après l'essai que l'on pourra dire si un groupe a été privilégié et lequel.

Le protocole

Le protocole est le document écrit qui, de manière à éviter toute ambiguïté d'interprétation et toute improvisation ultérieure, définit dans le détail : le but de l'essai, sa méthodologie, les sujets à inclure, les traitements à appliquer, le(s) critère(s) d'évaluation des traitements, le type d'analyse prévu, l'organisation pratique, et ce qu'il faut faire en cas de survenue d'un événement critique. Ce protocole est élaboré en commun par celui qui a pris l'initiative de l'essai (le promoteur), par les cliniciens qui réaliseront l'essai sur le terrain (investigateurs) et par des méthodologistes, et sa qualité garantit la valeur scientifique de l'essai. Il est le texte de référence à respecter scrupuleusement. Une fois accepté par les participants, il ne peut donner lieu à la moindre interprétation personnelle.

L'objectif de l'essai

Il doit être médicalement " intéressant ", c'est-à-dire susceptible d'apporter une réponse au minimum utile, si possible décisive ou nouvelle. Mûrement réfléchi après les études bibliographiques nécessaires, il faut aussi qu'il soit réaliste et tienne compte des moyens financiers et techniques disponibles. Enfin, il doit avoir obtenu l'adhésion de l'ensemble des participants à l'étude.
Il peut s'agir de démontrer l'efficacité d'un nouveau produit par rapport à un placebo, ou sa supériorité par rapport à un traitement de référence ; il peut s'agir d'une étude de sécurité d'emploi ou d'une étude dans certaines circonstances particulières (sujets âgés, insuffisants rénaux...), ou encore de la recherche du mécanisme d'action d'une substance... Au cours de l'infection par le VIH, différents objectifs peuvent être poursuivis : prévention de la survenue (prévention primaire) d'une infection opportuniste ou prévention de sa récidive (prévention secondaire), ralentissement de l'évolution de l'immunodépression ou amélioration de l'espérance de vie pour ce qui concerne le traitement de fond de l'infection. Quelle que soit sa nature, l'objectif sera clairement formulé, précis, et si possible limité à une seule question. Si l'on a prévu de s'intéresser conjointement à des objectifs
" secondaires ", il faut annoncer la question principale et n'en changer ni en cours d'essai ni, à plus forte raison, au vu des résultats !

La formulation de l'essai

L'attribution des traitements se fait par un tirage au sort (randomisation) dont on précisera très
clairement le moment et les modalités dans le
protocole.
Le double aveugle est toujours préférable, et la lecture à l'aveugle indispensable. Elle exige une mention particulière lorsque le double aveugle n'est pas possible ou s'il est imparfait.
La comparaison porte sur les résultats moyens de chacun des deux groupes lorsqu'il s'agit d'essai " en groupes parallèles ". Dans certains cas, le patient, pris comme son propre témoin, reçoit successivement, dans un ordre tiré au sort, les deux traitements à comparer. On parle alors d'essai croisé ou en " cross-over ". Ce type d'essai suppose des conditions particulières concernant le malade, sa maladie et les traitements étudiés. Il permet de réaliser un essai avec un plus petit nombre de patients, mais celui-ci est plus long.
Le nombre de sujets à inclure dans l'essai pour lui garantir la puissance désirée est calculé par
un méthodologiste statisticien. Ce calcul tient compte, entre autres facteurs, de l'importance de la différence que l'on espère mettre en évidence entre les deux traitements, autrement dit du gain espéré par l'emploi du nouveau produit (par exemple : une augmentation de 20 % de la survie à cinq ans).
L'essai multicentrique, c'est-à-dire réalisé simultanément dans plusieurs centres (hôpitaux, services...), permet d'assurer le recrutement du nombre de patients requis dans des délais raisonnables. A l'heure actuelle, outre ce caractère multicentrique, certains essais sont aussi internationaux, et partout menés suivant le même protocole. Ceci nécessite la mise en œuvre de procédures adaptées à la réalisation de ces essais.

Les caractéristiques des malades à recruter

Le choix des patients à inclure dans un essai comparatif, obéit à trois impératifs : qu'ils soient atteints de la maladie que l'on se propose de traiter, qu'ils forment un groupe bien défini et homogène, et que soit respectée la clause d'ambivalence.
La définition des critères d'inclusion varie suivant le but de l'essai : plus tourné vers la pratique ou, au contraire, vers la connaissance du produit. Le premier critère auquel les patients doivent satisfaire pour être inclus dans l'essai est la présence du symptôme ou de la maladie dont le traitement est justement l'objet de l'étude. Cela suppose qu'on utilise pour définir la maladie, ses formes symptomatiques ou ses stades évolutifs, des critères diagnostiques universellement admis.Un lymphome non hodgkinien, un sarcome de Kaposi, ne doivent pas être définis différemment à Paris et à Tokyo. Il faut aussi se méfier tout particulièrement des cas frontières et des états rapidement évolutifs. Au fur et à mesure de l'amélioration des connaissances sur l'évolution de l'infection par le VIH, sa classification et les critères employés lors de l'inclusion dans les essais, se sont affinés. La terminologie clinique initiale en terme d'ARC ou de sida n'est plus la seule prise en compte, s'y ajoutent aujourd'hui des critères biologiques : taux de lymphocytes CD4 ou présence d'une antigénémie p24 par exemple.
D'autres critères d'éligibilité concernent
le patient lui-même. Il peut s'agir de caractéristiques d'âge, de sexe, d'existence ou non d'autres pathologies associées.
On aboutit à une hypersélection, fondée sur des critères d'inclusion et de non-inclusion très stricts, qui rend le recrutement des malades plus difficile mais donne au produit toutes ses chances de montrer son effet. Cette hypersélection est également une garantie de sécurité d'emploi à stade de développement du produit. L'homogénéité de l'échantillon est une garantie de puissance pour l'essai : si un traitement est réellement actif, il est plus facile de le démontrer sur un groupe de patients homogène que sur un groupe hétérogène (de grande variabilité). Une fois l'efficacité démontrée dans ces conditions optimales pour les produits, il est toujours possible et souhaitable de poursuivre l'évaluation sur des groupes plus hétérogènes et plus représentatifs.
La clause d'ambivalence veut que tout patient inclus dans un essai soit à même de recevoir indifféremment l'un ou l'autre des traitements que le hasard lui assignera. Un essai comparant, par exemple, un geste chirurgical à une autre méthode thérapeutique ne peut recruter que des patients capables de subir une anesthésie générale.

Les traitements

Les sujets inclus dans un essai sont souvent déjà traités pour l'affection qui fait l'objet de l'étude. C'est fréquemment le cas des patients immunodéprimés. Leur recrutement ne se conçoit, du point de vue de l'éthique, que si le résultat du traitement antérieur peut être amélioré soit dans son efficacité, soit dans sa tolérance. Il est alors nécessaire de faire observer au patient une fenêtre thérapeutique, c'est-à-dire une période sans prise de médicament, qui permette la disparition des effets du traitement précédent sans que cela l'expose pour autant aux risques liés à une absence de traitement.
Faut-il donner un traitement de référence plutôt qu'un placebo aux patients du groupe témoin ? (On rappelle qu'il n'est licite d'employer un placebo que lorsqu'il n'existe pas de traitement de la maladie ou dans le cas d'une affection bénigne.) Dans l'affirmative, l'étape décisive est celle du choix du traitement de référence. L'usage veut que ce soit un traitement éprouvé, le meilleur traitement connu. Si la supériorité du nouveau produit n'est pas prouvée, on peut toujours espérer démontrer sa meilleure tolérance. Mais la rigueur de la comparaison passe aussi par le choix des durées des traitements, de leurs posologies respectives, qui doivent être optimales, des horaires des prises qui conditionnent parfois le moment de la mesure du critère de jugement...
L'emploi de posologies fixes, standard (les mêmes pour tous), n'est pas toujours possible. Car certains essais imposent des paliers prédéterminés, ou l'ajustement de la posologie sur le poids, sur la valeur fonctionnelle rénale, ou sur les données de la surveillance biologique et/ou clinique de l'efficacité et de la tolérance (créatininémie, enzymes hépatiques ou pancréatiques...). Cela complique la définition des traitements, mais c'est réalisable. Il faut cependant respecter certaines conditions : égalité dans les deux groupes, pas trop de paliers, et analyse globale des groupes comparés.
Un problème à ne surtout pas occulter est celui des traitements associés. Dans un essai, l'idéal pour l'évaluation serait que les patients puissent se passer de tout autre traitement que celui attribué par le sort et étudié. Cette monothérapie n'est le plus souvent pas possible, et le protocole doit donc préciser quels traitements associés seront autorisés ou non. Autorisés, ceux prescrits pour une autre pathologie et qui n'interagissent ni avec le produit testé ni avec son évaluation ; ceux dont les sujets bénéficiaient auparavant et dont il ne serait pas éthique de les priver sous prétexte d'essai (prophylaxie de la pneumocystose pulmonaire chez les patients ayant moins de 200 lymphocytes CD4/mm3 par exemple) ; ceux rendus nécessaires par la survenue d'effets indésirables dus au médicament testé (acide folinique lors des traitements comportants de la pyriméthamine par exemple). Il faut aussi prendre en considération la possibilité d'automédication.
Ce qui importe le plus, c'est que les médicaments autorisés et interdits soient les mêmes dans les deux groupes, et que cela soit bien analysé lors de la rédaction du protocole. En pratique une nécessaire souplesse s'impose, mais toute prise de médicaments, autres que ceux prévus dans le protocole, doit être scrupuleusement notée dans le cahier d'observation.

Les critères d'évaluation des traitements

La comparaison des traitements passe par le choix raisonné mais toujours discutable des meilleurs critères possibles mesurant l'efficacité et la tolérance. Dans l'idéal, on attend de ces critères qu'ils soient pertinents, c'est-à-dire qu'ils répondent au problème posé, qu'ils soient signifiants en termes cliniques, qu'ils fassent l'objet d'un consensus dans la communauté médicale, qu'ils soient disponibles chez tous les sujets, que leur recueil ne soit pas pénible pour les patients, que leur mesure soit facile, précise, reproductible, et qu'ils soient sensibles, c'est-à-dire aptes à déceler de petites différences.
On leur demande aussi d'être, si possible objectifs, comme, par exemple, un dosage biologique fourni par une machine et non pas du type " bon, moyen, nul " ; directs, c'est-à-dire traduisant directement le phénomène biologique ou médical étudié ou, à défaut, validés, autrement dit expliquant l'activité thérapeutique ; et uniques, comme peut l'être, par exemple, la cicatrisation endoscopiquement prouvée d'un ulcère du bulbe duodénal.
Toutefois, rares sont les pathologies dont l'expression se résume à un seul " maître-symptôme " et dont l'évolution peut ne se mesurer que par un seul critère. D'une façon générale, il faut éviter de multiplier les critères dont le nombre est à l'origine d'une multiplicité de tests rendant l'interprétation très délicate. Le protocole doit donc toujours privilégier un critère qualifié de " principal " (utilisé pour le calcul du nombre de sujets nécessaires à la mise en évidence de la différence espérée entre les traitements), les autres n'étant, dans la hiérarchie, considérés que comme des critères " accessoires " dont il n'est pas question de majorer ultérieurement l'importance, au vu des résultats.
On est parfois conduit à employer des combinaisons — fixées a priori, avec ou sans pondération — de critères, qui constituent alors des indices ou des scores d'expression chiffrée (échelle de Karnofsky permettant de mesurer une invalidité...), ce qui permet de quantifier des phénomènes subjectifs et fonctionnels, pour pouvoir mieux les comparer. Il faut cependant savoir qu'une mesure chiffrée n'est pas pour autant objective, comme en témoigne par exemple la prise de la tension artérielle, et cela même lorsque ses conditions de mesure sont parfaitement codifiées et standardisées.
A l'inverse, certaines évaluations ne peuvent et ne doivent être que subjectives. Ainsi, dans le cas de la douleur, seul le patient est à même d'exprimer ce qu'il ressent. Il le fait par l'intermédiaire d'échelles visuelles analogiques d'auto-évaluation ou de questionnaires prenant en compte l'ensemble de son comportement douloureux (double aveugle indispensable).
En pratique, on prendra garde à :

  • veiller à ce que l'appréciation du critère de jugement se fasse de la même manière dans les deux groupes et pour chacun des patients ;

  • standardiser les conditions et les techniques de mesure ;

  • former et entraîner les observateurs, principalement dans le cadre d'essais multicentriques ;

  • préciser le moment de recueil du critère, le même pour tous les patients de même groupe ;

  • faire impérativement évaluer le critère à l'aveugle si l'essai n'a pu se dérouler en double aveugle ;

  • centraliser la mesure du critère (dosage) surtout en cas de grande variabilité, ou sa lecture lorsque cette dernière est très délicate ou nécessite un matériel sophistiqué et peu répandu (ce qui est le cas pour certaines techniques de virologie quantitative).
    Si ce choix du critère de jugement ou d'évaluation ne pose pas de difficulté particulière dans le cadre d'un essai visant à tester l'efficacité d'un nouveau médicament pour prévenir la survenue d'une infection opportuniste, il n'en va pas de même en matière de thérapeutique antirétrovirale. Dans un premier temps, ce sont les événements cliniques qui ont été pris en considération comme marqueurs évolutifs de l'infection : survenue d'infections opportunistes ; espérance de vie. C'est par cette méthode que l'efficacité de l'AZT pour ralentir l'évolution de l'infection a été mise en évidence en 1986. Mais l'objectif actuellement poursuivi est de substituer à ces critères cliniques d'autres critères (biologiques, immunologiques et surtout virologiques) qui puissent être obtenus beaucoup plus rapidement et qui soient corrélés à l'évolution clinique ultérieure. Ces marqueurs sont désignés sous le terme de " critères de substitution ". Ils permettraient une évaluation plus rapide du candidat-médicament, et ainsi sa mise à disposition précoce en cas d'efficacité mais aussi son abandon plus rapide en cas d'inefficacité. La validation de ce type de marqueur est donc cruciale dans l'infection par le VIH. Elle se heurte encore à des difficultés d'ordre technique, mais surtout aujourd'hui aux limites de nos connaissances sur la physiopathologie de l'infection.
    En outre et en particulier pour des maladies chroniques imposant la prise prolongée d'un médicament, de tels critères renseignent mal sur le rapport bénéfice/risque. Le problème est d'autant plus important que le médicament testé est potentiellement toxique et qu'à moyen ou long terme, les effets secondaires peuvent l'emporter sur un bénéfice pharmacologique à court terme.

L'analyse de l'essai

L'analyse de l'essai intervient une fois tous les sujets inclus et évalués. Dans le cas contraire, il s'agit d'une analyse intermédiaire qui doit avoir été prévue par le protocole et qui nécessite une méthodologie spécifique. Il est indispensable que l'analyse porte sur des données aussi complètes et aussi correctes que possible.
Elle s'attache d'abord à décrire les caractéristiques des sujets inclus afin de savoir à quel type de patients pourront s'appliquer les résultats observés. Par ailleurs, elle dénombre, décrit et précise le moment et le motif de survenue des écarts au protocole : patients inclus à tort, ayant modifié ou interrompu leur traitement, perdus de vue, et qui n'ont donc pas pu être évalués. Leur taux donne une idée de la faisabilité de l'essai et de l'acceptabilité des traitements.
Enfin, l'analyse compare les résultats des groupes selon la méthodologie statistique appropriée et planifiée, à partir du (ou des) seul(s) critère(s) de jugement initialement prévu(s). On ne doit pas ignorer, à ce propos, que la multiplicité des critères (souvent non indépendants), par conséquent la multiplicité des tests, augmente le risque de trouver, à tort, des différences significatives. La comparaison concerne aussi bien l'efficacité que la tolérance. Elle doit porter sur tous les sujets inclus dans l'essai selon le traitement attribué par le sort, sans tenir compte du traitement effectivement reçu.
Cette façon de procéder, appelée analyse en " intention de traiter ", peut paraître choquante pour certains qui s'étonnent qu'on tienne compte, pour évaluer les résultats d'un traitement, des malades ayant mal pris ce traitement, ne l'ayant pas pris du tout ou même ayant pris l'autre. Elle est, en fait, le seul moyen de répondre sans biais à la question posée et correspond à l'attitude adoptée en pratique médicale courante (1).
Lorsqu'un effet important est attendu pour une maladie grave, des analyses intermédiaires sont habituellement prévues. On peut aussi proposer une stratégie spécifique d'analyse dite séquentielle.
Les résultats seront présentés de manière claire, directement accessible au lecteur. S'ils sont statistiquement significatifs, on devra vérifier que la différence n'est pas due à un biais avant de conclure à l'efficacité ou à la supériorité de l'un des traitements, et s'assurer que cette différence est cliniquement " intéressante ". Si les résultats ne diffèrent pas significativement, on se posera la question de savoir si ce n'est pas par suite d'un manque de puissance (à vérifier quand c'est possible), à cause d'un effectif insuffisant de sujets inclus. Mais, que les résultats aient ou non été trouvés différents, il importe de connaître l'intervalle de confiance de leur différence, en particulier, pour avoir une idée de son ordre de grandeur et de son intérêt en termes de santé.

La réalisation pratique et le suivi de l'essai

Un essai clinique est une entreprise
difficile, astreignante, coûteuse, rarement renouvelable, et qui ne doit donc pas être sabotée. Disposer d'un bon protocole, s'assurer la collaboration d'un
analyste rigoureux et être animé des meilleures intentions ne suffisent pas. On peut toujours
" reprendre " une mauvaise analyse si l'essai est de qualité et s'il a porté sur de bonnes données, mais on ne peut jamais, en revanche, compenser, par quelque test statistique que ce soit, la
mauvaise qualité d'une étude. La qualité de la réalisation d'un essai est le fondement même de sa crédibilité.
L'initiative de la réalisation de l'essai appartient généralement à l'industrie pharmaceutique,
qui joue alors le rôle de promoteur. Pour gérer l'essai, le promoteur choisit un moniteur qui,
en particulier avec l'aide des assistants de
recherche clinique (ARC) ou des techniciens d'études cliniques (TEC), coordonne les activités de chaque investigateur et contrôle le suivi.
La réalisation pratique et le suivi de l'essai tirent grand profit du respect des bonnes pratiques
cliniques et des impératifs de coordination,
de standardisation et de communication entre les différents partenaires.

Les bonnes pratiques cliniques (BPC)

Les BPC sont un ensemble de dispositions (mises en place en France en 1987) pour assurer aux essais la qualité et l'authenticité des données, et le respect de l'éthique. Elles précisent les responsabilités respectives du promoteur et de l'investigateur. Elles participent au système d'assurance de la qualité du médicament.
L'investigateur doit être qualifié dans sa discipline d'exercice et dans le domaine des essais cliniques. Il doit bien connaître les produits étudiés, les documents de prérequis, le protocole (à l'élaboration duquel il peut participer et sur lequel il a donné son avis) et ses annexes, dont le cahier d'observation. Ses locaux et ses équipements doivent être adéquats, ne serait-ce que pour la sécurité des patients. Ces points, comme la pertinence méthodologique du protocole, doivent être examinés par le comité consultatif de protection des personnes qui se prêtent à des recherches biomédicales dont l'avis a été sollicité.
Le recrutement des patients doit être :

  • suffisant et régulier, pour garantir le bon déroulement de l'essai dans le délai imparti ;

  • vigilant, afin de ne pas inclure des sujets dont la surveillance serait difficile, voire impossible ;

  • pertinent, sans laxisme ni dérive, c'est-à-dire ne concernant que des patients strictement éligibles selon le protocole.
    L'investigateur s'engage à se conformer aux BPC et à accepter, notamment, les visites périodiques du moniteur, des assistants de recherche clinique, ou même celles suscitées par les autorités de tutelle. Il constitue son équipe (médecins et infirmières), qu'il informe en détail des modalités de l'essai, et qu'il peut être amené à " former ", en particulier pour le recrutement des patients et le recueil des critères d'évaluation (prise de la tension artérielle, réponse au questionnaire...), et au sein de laquelle, seul responsable, il répartit les tâches.
    Pendant le déroulement de l'essai, l'investigateur respecte scrupuleusement le protocole et ses annexes. Aidé de l'assistant de recherche clinique, qui lui rend visite périodiquement et répond à chacun de ses appels, il veille à l'authenticité et à la qualité du recueil des données consignées de manière lisible et indélébile, en temps réel et au fur et à mesure, sur les cahiers d'observation, en conformité avec le contenu du dossier hospitalier ou de la fiche de consultation. Il évite les erreurs, les omissions, les négligences dans le suivi des malades (nature, rythme, régularité des rendez-vous). Disponible pour l'essai, il met tout en œuvre, avec son équipe, pour favoriser l'observance des traitements et réduire le nombre de perdus de vue (un nombre important de perdus de vue peut invalider les résultats d'un essai). Il est à l'affût de la survenue de tout événement critique dont il informe le plus rapidement possible le moniteur et qui, exceptionnellement et sous sa seule responsabilité, peut, si le pronostic vital est en jeu, justifier l'ouverture du code du traitement reçu, autrement dit la levée de l'aveugle pour le patient en question.

Impératifs des essais multicentriques

Plus le gain thérapeutique à espérer d'un nouveau traitement est modeste, plus il faut inclure de sujets dans l'essai pour espérer le mettre en évidence. Dans ces conditions, il est presque toujours impossible à un seul centre (surtout si la maladie est rare) d'assurer, dans des délais raisonnables, le recrutement de l'effectif requis. En revanche, l'association de plusieurs centres dans un essai commun permet d'obtenir plus facilement le nombre de sujets nécessaires, de raccourcir la durée d'inclusion des malades et d'éviter ainsi, compte tenu de la rapide évolution des connaissances médicales, que les participants ne soient démotivés et que l'essai ne devienne obsolète avant d'être terminé.
Un essai multicentrique n'est pas chose facile à gérer. Il nécessite coordination, standardisation, communication :
La coordination est assurée par un centre coordinateur qui a la charge de former les investigateurs à l'occasion de réunions préalables et en cours d'essai ; qui prépare le conditionnement des produits destinés à l'essai et organise le tirage au sort de l'attribution des traitements dans chaque centre (stratification du tirage au sort sur le centre) ; et qui gère l'essai au jour le jour, vérifie constamment la qualité des données et l'existence d'écarts au protocole, supervise et encadre l'activité de chaque centre.
La standardisation intéresse surtout les méthodes de diagnostic et d'évaluation des résultats. C'est ainsi qu'on sera amené à choisir, avant le début de l'essai, les critères à retenir par l'ensemble des investigateurs pour définir la maladie et les malades à inclure ; à uniformiser entre les centres les appareillages et les techniques de dosages biologiques, les interprétations de clichés radiographiques ou de tracés électrocardiographiques... Le questionnaire, simple et clair, ne traitera que des informations en relation directe avec l'essai.
La communication entre tous les partenaires de l'essai est à privilégier. Non seulement à
propos de l'objectif, qui devra être simple, avoir été compris et admis de tous sans réserve, mais aussi à propos du protocole qui, élaboré en commun sans tomber toutefois dans le travers de trop nombreux et inutiles amendements, sera mieux accepté, et donc mieux respecté de tous. Tout au long de l'essai, l'information circulera
du centre coordinateur vers les investigateurs et inversement, en particulier grâce aux visites des assistants de recherche clinique et à des systèmes de communication interactive
(Minitel...)

Conclusion

A notre époque où les progrès thérapeutiques se font pas à pas, l'essai
clinique comparatif représente, pour le candidat-médicament
qu'il aide à mieux connaître, l'outil le plus performant et le plus propre à administrer la preuve de son efficacité, sinon de sa sécurité d'emploi.
Il repose sur quelques principes fondamentaux : comparaison de deux (ou plus) groupes de traitement, tirage au sort entre les patients de l'attribution des traitements, utilisation des méthodes " aveugles ", analyse de tous les sujets inclus...
Sa rigueur satisfait la soif de logique ; la qualité et le sérieux de sa réalisation, le désir d'authenticité. Il ne faudra toutefois pas méconnaître ses limites : l'essai clinique n'est pas une panacée, et il est moins bien adapté à l'évaluation d'autres méthodes thérapeutiques que le médicament ;
il n'est construit que pour répondre à une question préalablement posée. Si cette question n'est ni pertinente ni réaliste ou est trop ambitieuse, la réponse (oui ou non, les traitements diffèrent-ils ?) ne sera d'aucune utilité. On aura travaillé en vain.

Pour plus d'informations

  • Cesam, Spec. Cours polycopié Cesam.
    Edit 1991.

  • Essais thérapeutiques, mode d'emploi.
    E. Eschwège, G. Bouvenot, F. Doyon, A. Lacroux. Inserm - Paris 1990.

  • Le traitement précoce de l'infection à VIH. Recommandations sur les protocoles et modes de soins les plus appropriés, juin 1990.
    Rapport au ministre d'un groupe d'experts présidé par J. Dormont. Flammarion Médecine Sciences, Paris, 1991.

  • Protection des personnes dans la recherche biomédicale. Guide des textes législatifs et réglementaires, Tome I et II.
    B.O. n° 91/13 bis - Septembre 1991.

  • L'Europe du médicament : réalités et ambitions.
    4e colloque DPhM-Inserm - Volume 213 -
    Inserm.

  • Qu'est-ce qu'un essai thérapeutique ? Document d'information préparé par l'Anrs, avril 1991 (disponible à l'Anrs, 66 bis, avenue Jean-Moulin, 75014 Paris).