Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
Put back serialize calls... and fix introduced bugs.
authordegomme <augustin.degomme@unibas.ch>
Thu, 9 Mar 2017 16:43:29 +0000 (17:43 +0100)
committerdegomme <augustin.degomme@unibas.ch>
Thu, 9 Mar 2017 16:53:03 +0000 (17:53 +0100)
src/smpi/private.h
src/smpi/smpi_datatype.cpp
src/smpi/smpi_datatype.hpp
src/smpi/smpi_pmpi.cpp
src/smpi/smpi_request.cpp

index 6bfa017..e29b277 100644 (file)
@@ -48,30 +48,6 @@ enum smpi_process_state{
   SMPI_FINALIZED
 };
 
-// this struct is here to handle the problem of non-contignous data
-// for each such structure these function should be implemented (vector
-// index hvector hindex struct)
-typedef struct s_smpi_subtype{
-  void (*serialize)(void * input, void *output, int count, void* subtype);
-  void (*unserialize)(void * input, void *output, int count, void* subtype, MPI_Op op);
-  void (*subtype_free)(MPI_Datatype* type);
-  void (*subtype_use)(MPI_Datatype* type);
-} s_smpi_subtype_t;
-
-typedef struct s_smpi_mpi_datatype{
-  char* name;
-  size_t size;
-  /* this let us know if a serialization is required*/
-  size_t sizeof_substruct;
-  MPI_Aint lb;
-  MPI_Aint ub;
-  int flags;
-  xbt_dict_t attributes;
-  /* this let us know how to serialize and unserialize*/
-  void *substruct;
-  int in_use;
-} s_smpi_mpi_datatype_t;
-
 #define COLL_TAG_REDUCE -112
 #define COLL_TAG_SCATTER -223
 #define COLL_TAG_SCATTERV -334
index 8accf8d..028c0e9 100644 (file)
@@ -107,7 +107,7 @@ CREATE_MPI_DATATYPE(MPI_PTR, void*);
 namespace simgrid{
 namespace smpi{
 
-Datatype::Datatype(int size,int lb, int ub, int flags) : name_(nullptr), lb_(lb), ub_(ub), flags_(flags), attributes_(nullptr), in_use_(1){
+Datatype::Datatype(int size,MPI_Aint lb, MPI_Aint ub, int flags) : name_(nullptr), size_(size), lb_(lb), ub_(ub), flags_(flags), attributes_(nullptr), in_use_(1){
 #if HAVE_MC
   if(MC_is_active())
     MC_ignore(&(in_use_), sizeof(in_use_));
@@ -115,18 +115,17 @@ Datatype::Datatype(int size,int lb, int ub, int flags) : name_(nullptr), lb_(lb)
 }
 
 //for predefined types, so in_use = 0.
-Datatype::Datatype(char* name, int size,int lb, int ub, int flags) : name_(name), lb_(lb), ub_(ub), flags_(flags), attributes_(nullptr), in_use_(0){
+Datatype::Datatype(char* name, int size,MPI_Aint lb, MPI_Aint ub, int flags) : name_(name), size_(size), lb_(lb), ub_(ub), flags_(flags), attributes_(nullptr), in_use_(0){
 #if HAVE_MC
   if(MC_is_active())
     MC_ignore(&(in_use_), sizeof(in_use_));
 #endif
 }
 
-
-//TODO : subtypes ?
-Datatype::Datatype(Datatype *datatype) : lb_(datatype->lb_), ub_(datatype->ub_), flags_(datatype->flags_), in_use_(1)
+Datatype::Datatype(Datatype *datatype, int* ret) : name_(nullptr), lb_(datatype->lb_), ub_(datatype->ub_), flags_(datatype->flags_), attributes_(nullptr), in_use_(1)
 {
   flags_ &= ~DT_FLAG_PREDEFINED;
+  *ret = MPI_SUCCESS;
   if(datatype->name_)
     name_ = xbt_strdup(datatype->name_);
   if(datatype->attributes_ !=nullptr){
@@ -140,11 +139,10 @@ Datatype::Datatype(Datatype *datatype) : lb_(datatype->lb_), ub_(datatype->ub_),
       smpi_type_key_elem elem =
           static_cast<smpi_type_key_elem>(xbt_dict_get_or_null_ext(smpi_type_keyvals, key, sizeof(int)));
       if (elem != nullptr && elem->copy_fn != MPI_NULL_COPY_FN) {
-        int ret = elem->copy_fn(datatype, atoi(key), nullptr, value_in, &value_out, &flag);
-        if (ret != MPI_SUCCESS) {
-//          smpi_datatype_unuse(*new_t);
-//          *new_t = MPI_DATATYPE_NULL;
+        *ret = elem->copy_fn(datatype, atoi(key), nullptr, value_in, &value_out, &flag);
+        if (*ret != MPI_SUCCESS) {
           xbt_dict_cursor_free(&cursor);
+          break;
         }
         if (flag)
           xbt_dict_set_ext(attributes_, key, sizeof(int), value_out, nullptr);
@@ -372,41 +370,36 @@ int Datatype::unpack(void* inbuf, int insize, int* position, void* outbuf, int o
 
 int Datatype::copy(void *sendbuf, int sendcount, MPI_Datatype sendtype,
                        void *recvbuf, int recvcount, MPI_Datatype recvtype){
-//  int count;
+  int count;
   if(smpi_privatize_global_variables){
     smpi_switch_data_segment(smpi_process_index());
   }
   /* First check if we really have something to do */
   if (recvcount > 0 && recvbuf != sendbuf) {
-    /* FIXME: treat packed cases */
     sendcount *= sendtype->size();
     recvcount *= recvtype->size();
-//    count = sendcount < recvcount ? sendcount : recvcount;
-
-//    if(sendtype->sizeof_substruct == 0 && recvtype->sizeof_substruct == 0) {
-//      if(!smpi_process_get_replaying()) 
-//        memcpy(recvbuf, sendbuf, count);
-//    }
-//    else if (sendtype->sizeof_substruct == 0)
-//    {
-//      s_smpi_subtype_t *subtype =  recvtype->substruct);
-//      subtype->unserialize( sendbuf, recvbuf, recvcount/recvtype->size(), subtype, MPI_REPLACE);
-//    }
-//    else if (recvtype->sizeof_substruct == 0)
-//    {
-//      s_smpi_subtype_t *subtype =  sendtype->substruct);
-//      subtype->serialize(sendbuf, recvbuf, sendcount/sendtype->size(), subtype);
-//    }else{
-//      s_smpi_subtype_t *subtype =  sendtype->substruct);
-
-//      void * buf_tmp = xbt_malloc(count);
-
-//      subtype->serialize( sendbuf, buf_tmp,count/sendtype->size(), subtype);
-//      subtype =  recvtype->substruct);
-//      subtype->unserialize( buf_tmp, recvbuf,count/recvtype->size(), subtype, MPI_REPLACE);
-
-//      xbt_free(buf_tmp);
-//    }
+    count = sendcount < recvcount ? sendcount : recvcount;
+
+    if(!(sendtype->flags() & DT_FLAG_DERIVED) && !(recvtype->flags() & DT_FLAG_DERIVED)) {
+      if(!smpi_process_get_replaying()) 
+        memcpy(recvbuf, sendbuf, count);
+    }
+    else if (!(sendtype->flags() & DT_FLAG_DERIVED))
+    {
+      recvtype->unserialize( sendbuf, recvbuf, recvcount/recvtype->size(), MPI_REPLACE);
+    }
+    else if (!(recvtype->flags() & DT_FLAG_DERIVED))
+    {
+      sendtype->serialize(sendbuf, recvbuf, sendcount/sendtype->size());
+    }else{
+
+      void * buf_tmp = xbt_malloc(count);
+
+      sendtype->serialize( sendbuf, buf_tmp,count/sendtype->size());
+      recvtype->unserialize( buf_tmp, recvbuf,count/recvtype->size(), MPI_REPLACE);
+
+      xbt_free(buf_tmp);
+    }
   }
 
   return sendcount > recvcount ? MPI_ERR_TRUNCATE : MPI_SUCCESS;
@@ -441,24 +434,24 @@ int Datatype::create_contiguous(int count, MPI_Datatype old_type, MPI_Aint lb, M
   return MPI_SUCCESS;
 }
 
-int Datatype::create_vector(int count, int blocklen, int stride, MPI_Datatype old_type, MPI_Datatype* new_type)
+int Datatype::create_vector(int count, int block_length, int stride, MPI_Datatype old_type, MPI_Datatype* new_type)
 {
   int retval;
-  if (blocklen<0) 
+  if (block_length<0) 
     return MPI_ERR_ARG;
   MPI_Aint lb = 0;
   MPI_Aint ub = 0;
   if(count>0){
     lb=old_type->lb();
-    ub=((count-1)*stride+blocklen-1)*old_type->get_extent()+old_type->ub();
+    ub=((count-1)*stride+block_length-1)*old_type->get_extent()+old_type->ub();
   }
-  if(old_type->flags() & DT_FLAG_DERIVED || stride != blocklen){
-    *new_type = new Type_Vector(count * (blocklen) * old_type->size(), lb, ub,
-                                   DT_FLAG_DERIVED, count, blocklen, stride, old_type);
+  if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length){
+    *new_type = new Type_Vector(count * (block_length) * old_type->size(), lb, ub,
+                                   DT_FLAG_DERIVED, count, block_length, stride, old_type);
     retval=MPI_SUCCESS;
   }else{
     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
-    *new_type = new Datatype(count * blocklen * old_type->size(), 0, ((count -1) * stride + blocklen)*
+    *new_type = new Datatype(count * block_length * old_type->size(), 0, ((count -1) * stride + block_length)*
                          old_type->size(), DT_FLAG_CONTIGUOUS);
     retval=MPI_SUCCESS;
   }
@@ -466,50 +459,50 @@ int Datatype::create_vector(int count, int blocklen, int stride, MPI_Datatype ol
 }
 
 
-int Datatype::create_hvector(int count, int blocklen, MPI_Aint stride, MPI_Datatype old_type, MPI_Datatype* new_type)
+int Datatype::create_hvector(int count, int block_length, MPI_Aint stride, MPI_Datatype old_type, MPI_Datatype* new_type)
 {
   int retval;
-  if (blocklen<0) 
+  if (block_length<0) 
     return MPI_ERR_ARG;
   MPI_Aint lb = 0;
   MPI_Aint ub = 0;
   if(count>0){
     lb=old_type->lb();
-    ub=((count-1)*stride+blocklen-1)*old_type->get_extent()+old_type->ub();
+    ub=((count-1)*stride)+(block_length-1)*old_type->get_extent()+old_type->ub();
   }
-  if(old_type->flags() & DT_FLAG_DERIVED || stride != blocklen*old_type->get_extent()){
-    *new_type = new Type_Hvector(count * (blocklen) * old_type->size(), lb, ub,
-                                   DT_FLAG_DERIVED, count, blocklen, stride, old_type);
+  if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length*old_type->get_extent()){
+    *new_type = new Type_Hvector(count * (block_length) * old_type->size(), lb, ub,
+                                   DT_FLAG_DERIVED, count, block_length, stride, old_type);
     retval=MPI_SUCCESS;
   }else{
     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
-    *new_type = new Datatype(count * blocklen * old_type->size(), 0, count * blocklen * old_type->size(), DT_FLAG_CONTIGUOUS);
+    *new_type = new Datatype(count * block_length * old_type->size(), 0, count * block_length * old_type->size(), DT_FLAG_CONTIGUOUS);
     retval=MPI_SUCCESS;
   }
   return retval;
 }
 
-int Datatype::create_indexed(int count, int* blocklens, int* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
+int Datatype::create_indexed(int count, int* block_lengths, int* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
   int size = 0;
   bool contiguous=true;
   MPI_Aint lb = 0;
   MPI_Aint ub = 0;
   if(count>0){
     lb=indices[0]*old_type->get_extent();
-    ub=indices[0]*old_type->get_extent() + blocklens[0]*old_type->ub();
+    ub=indices[0]*old_type->get_extent() + block_lengths[0]*old_type->ub();
   }
 
   for (int i = 0; i < count; i++) {
-    if (blocklens[i] < 0)
+    if (block_lengths[i] < 0)
       return MPI_ERR_ARG;
-    size += blocklens[i];
+    size += block_lengths[i];
 
     if(indices[i]*old_type->get_extent()+old_type->lb()<lb)
       lb = indices[i]*old_type->get_extent()+old_type->lb();
-    if(indices[i]*old_type->get_extent()+blocklens[i]*old_type->ub()>ub)
-      ub = indices[i]*old_type->get_extent()+blocklens[i]*old_type->ub();
+    if(indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub()>ub)
+      ub = indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub();
 
-    if ( (i< count -1) && (indices[i]+blocklens[i] != indices[i+1]) )
+    if ( (i< count -1) && (indices[i]+block_lengths[i] != indices[i+1]) )
       contiguous=false;
   }
   if(old_type->flags_ & DT_FLAG_DERIVED)
@@ -517,34 +510,33 @@ int Datatype::create_indexed(int count, int* blocklens, int* indices, MPI_Dataty
 
   if(!contiguous){
     *new_type = new Type_Indexed(size * old_type->size(),lb,ub,
-                                 DT_FLAG_DERIVED|DT_FLAG_DATA, count, blocklens, indices, old_type);
+                                 DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
   }else{
-    *new_type = new Type_Contiguous(size * old_type->size(), lb, ub,
-                                    DT_FLAG_DERIVED|DT_FLAG_CONTIGUOUS, size, old_type);
+    Datatype::create_contiguous(size, old_type, lb, new_type);
   }
   return MPI_SUCCESS;
 }
 
-int Datatype::create_hindexed(int count, int* blocklens, MPI_Aint* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
+int Datatype::create_hindexed(int count, int* block_lengths, MPI_Aint* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
   int size = 0;
   bool contiguous=true;
   MPI_Aint lb = 0;
   MPI_Aint ub = 0;
   if(count>0){
     lb=indices[0] + old_type->lb();
-    ub=indices[0] + blocklens[0]*old_type->ub();
+    ub=indices[0] + block_lengths[0]*old_type->ub();
   }
   for (int i = 0; i < count; i++) {
-    if (blocklens[i] < 0)
+    if (block_lengths[i] < 0)
       return MPI_ERR_ARG;
-    size += blocklens[i];
+    size += block_lengths[i];
 
     if(indices[i]+old_type->lb()<lb) 
       lb = indices[i]+old_type->lb();
-    if(indices[i]+blocklens[i]*old_type->ub()>ub) 
-      ub = indices[i]+blocklens[i]*old_type->ub();
+    if(indices[i]+block_lengths[i]*old_type->ub()>ub) 
+      ub = indices[i]+block_lengths[i]*old_type->ub();
 
-    if ( (i< count -1) && (indices[i]+blocklens[i]*(static_cast<int>(old_type->size())) != indices[i+1]) )
+    if ( (i< count -1) && (indices[i]+block_lengths[i]*(static_cast<int>(old_type->size())) != indices[i+1]) )
       contiguous=false;
   }
   if (old_type->flags_ & DT_FLAG_DERIVED || lb!=0)
@@ -552,15 +544,14 @@ int Datatype::create_hindexed(int count, int* blocklens, MPI_Aint* indices, MPI_
 
   if(!contiguous){
     *new_type = new Type_Hindexed(size * old_type->size(),lb,ub,
-                                   DT_FLAG_DERIVED|DT_FLAG_DATA, count, blocklens, indices, old_type);
+                                   DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
   }else{
-    *new_type = new Type_Contiguous(size * old_type->size(), lb, ub,
-                                   DT_FLAG_DERIVED|DT_FLAG_CONTIGUOUS, size, old_type);
+    Datatype::create_contiguous(size, old_type, lb, new_type);
   }
   return MPI_SUCCESS;
 }
 
-int Datatype::create_struct(int count, int* blocklens, MPI_Aint* indices, MPI_Datatype* old_types, MPI_Datatype* new_type){
+int Datatype::create_struct(int count, int* block_lengths, MPI_Aint* indices, MPI_Datatype* old_types, MPI_Datatype* new_type){
   size_t size = 0;
   bool contiguous=true;
   size = 0;
@@ -568,17 +559,17 @@ int Datatype::create_struct(int count, int* blocklens, MPI_Aint* indices, MPI_Da
   MPI_Aint ub = 0;
   if(count>0){
     lb=indices[0] + old_types[0]->lb();
-    ub=indices[0] + blocklens[0]*old_types[0]->ub();
+    ub=indices[0] + block_lengths[0]*old_types[0]->ub();
   }
   bool forced_lb=false;
   bool forced_ub=false;
   for (int i = 0; i < count; i++) {
-    if (blocklens[i]<0)
+    if (block_lengths[i]<0)
       return MPI_ERR_ARG;
     if (old_types[i]->flags_ & DT_FLAG_DERIVED)
       contiguous=false;
 
-    size += blocklens[i]*old_types[i]->size();
+    size += block_lengths[i]*old_types[i]->size();
     if (old_types[i]==MPI_LB){
       lb=indices[i];
       forced_lb=true;
@@ -590,25 +581,24 @@ int Datatype::create_struct(int count, int* blocklens, MPI_Aint* indices, MPI_Da
 
     if(!forced_lb && indices[i]+old_types[i]->lb()<lb) 
       lb = indices[i];
-    if(!forced_ub &&  indices[i]+blocklens[i]*old_types[i]->ub()>ub)
-      ub = indices[i]+blocklens[i]*old_types[i]->ub();
+    if(!forced_ub &&  indices[i]+block_lengths[i]*old_types[i]->ub()>ub)
+      ub = indices[i]+block_lengths[i]*old_types[i]->ub();
 
-    if ( (i< count -1) && (indices[i]+blocklens[i]*static_cast<int>(old_types[i]->size()) != indices[i+1]) )
+    if ( (i< count -1) && (indices[i]+block_lengths[i]*static_cast<int>(old_types[i]->size()) != indices[i+1]) )
       contiguous=false;
   }
   if(!contiguous){
     *new_type = new Type_Struct(size, lb,ub, DT_FLAG_DERIVED|DT_FLAG_DATA, 
-                                count, blocklens, indices, old_types);
+                                count, block_lengths, indices, old_types);
   }else{
-    *new_type = new Type_Contiguous(size, lb, ub,
-                                   DT_FLAG_DERIVED|DT_FLAG_CONTIGUOUS, size, MPI_CHAR);
+    Datatype::create_contiguous(size, MPI_CHAR, lb, new_type);
   }
   return MPI_SUCCESS;
 }
 
 
 
-Type_Contiguous::Type_Contiguous(int size, int lb, int ub, int flags, int block_count, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(block_count), old_type_(old_type){
+Type_Contiguous::Type_Contiguous(int size, MPI_Aint lb, MPI_Aint ub, int flags, int block_count, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(block_count), old_type_(old_type){
   old_type_->use();
 }
 
@@ -638,7 +628,7 @@ void Type_Contiguous::unserialize( void* contiguous_buf, void *noncontiguous_buf
 
 
 
-Type_Vector::Type_Vector(int size,int lb, int ub, int flags, int count, int blocklen, int stride, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(count), block_length_(blocklen),block_stride_(stride),  old_type_(old_type){
+Type_Vector::Type_Vector(int size,MPI_Aint lb, MPI_Aint ub, int flags, int count, int block_length, int stride, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(count), block_length_(block_length),block_stride_(stride),  old_type_(old_type){
 old_type_->use();
 }
 
@@ -693,7 +683,7 @@ void Type_Vector::unserialize( void* contiguous_buf, void *noncontiguous_buf,
   }
 }
 
-Type_Hvector::Type_Hvector(int size,int lb, int ub, int flags, int count, int blocklen, MPI_Aint stride, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(count), block_length_(blocklen), block_stride_(stride), old_type_(old_type){
+Type_Hvector::Type_Hvector(int size,MPI_Aint lb, MPI_Aint ub, int flags, int count, int block_length, MPI_Aint stride, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(count), block_length_(block_length), block_stride_(stride), old_type_(old_type){
   old_type->use();
 }
 Type_Hvector::~Type_Hvector(){
@@ -744,15 +734,21 @@ void Type_Hvector::unserialize( void* contiguous_buf, void *noncontiguous_buf,
   }
 }
 
-Type_Indexed::Type_Indexed(int size,int lb, int ub, int flags, int count, int* blocklens, int* indices, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(count), block_lengths_(blocklens), block_indices_(indices), old_type_(old_type){
+Type_Indexed::Type_Indexed(int size,MPI_Aint lb, MPI_Aint ub, int flags, int count, int* block_lengths, int* block_indices, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(count), old_type_(old_type){
   old_type->use();
+  block_lengths_ = new int[count];
+  block_indices_ = new int[count];
+  for (int i = 0; i < count; i++) {
+    block_lengths_[i]=block_lengths[i];
+    block_indices_[i]=block_indices[i];
+  }
 }
 
 Type_Indexed::~Type_Indexed(){
   old_type_->unuse();
   if(in_use_==0){
-    xbt_free(block_lengths_);
-    xbt_free(block_indices_);
+    delete[] block_lengths_;
+    delete[] block_indices_;
   }
 }
 
@@ -808,15 +804,23 @@ void Type_Indexed::unserialize( void* contiguous_buf, void *noncontiguous_buf,
   }
 }
 
-Type_Hindexed::Type_Hindexed(int size,int lb, int ub, int flags, int count, int* blocklens, MPI_Aint* indices, MPI_Datatype old_type): Datatype(size, lb, ub, flags), block_count_(count), block_lengths_(blocklens), block_indices_(indices), old_type_(old_type){
+Type_Hindexed::Type_Hindexed(int size,MPI_Aint lb, MPI_Aint ub, int flags, int count, int* block_lengths, MPI_Aint* block_indices, MPI_Datatype old_type)
+: Datatype(size, lb, ub, flags), block_count_(count), old_type_(old_type)
+{
   old_type_->use();
+  block_lengths_ = new int[count];
+  block_indices_ = new MPI_Aint[count];
+  for (int i = 0; i < count; i++) {
+    block_lengths_[i]=block_lengths[i];
+    block_indices_[i]=block_indices[i];
+  }
 }
 
     Type_Hindexed::~Type_Hindexed(){
   old_type_->unuse();
   if(in_use_==0){
-    xbt_free(block_lengths_);
-    xbt_free(block_indices_);
+    delete[] block_lengths_;
+    delete[] block_indices_;
   }
 }
 
@@ -867,8 +871,14 @@ void Type_Hindexed::unserialize( void* contiguous_buf, void *noncontiguous_buf,
   }
 }
 
-Type_Struct::Type_Struct(int size,int lb, int ub, int flags, int count, int* blocklens, MPI_Aint* indices, MPI_Datatype* old_types): Datatype(size, lb, ub, flags), block_count_(count), block_lengths_(blocklens), block_indices_(indices), old_types_(old_types){
+Type_Struct::Type_Struct(int size,MPI_Aint lb, MPI_Aint ub, int flags, int count, int* block_lengths, MPI_Aint* block_indices, MPI_Datatype* old_types): Datatype(size, lb, ub, flags), block_count_(count), block_lengths_(block_lengths), block_indices_(block_indices), old_types_(old_types){
+  block_lengths_= new int[count];
+  block_indices_= new MPI_Aint[count];
+  old_types_=  new MPI_Datatype[count];
   for (int i = 0; i < count; i++) {
+    block_lengths_[i]=block_lengths[i];
+    block_indices_[i]=block_indices[i];
+    old_types_[i]=old_types[i];
     old_types_[i]->use();
   }
 }
@@ -878,9 +888,9 @@ Type_Struct::~Type_Struct(){
     old_types_[i]->unuse();
   }
   if(in_use_==0){
-    xbt_free(block_lengths_);
-    xbt_free(block_indices_);
-    xbt_free(old_types_);
+    delete[] block_lengths_;
+    delete[] block_indices_;
+    delete[] old_types_;
   }
 }
 
index 57983e1..256b06a 100644 (file)
@@ -78,8 +78,7 @@ namespace simgrid{
 namespace smpi{
 
 class Datatype{
-//TODO: remove
-  public:
+  protected:
     char* name_;
     size_t size_;
     MPI_Aint lb_;
@@ -89,9 +88,9 @@ class Datatype{
     int in_use_;
 
   public:
-    Datatype(int size,int lb, int ub, int flags);
-    Datatype(char* name, int size,int lb, int ub, int flags);
-    Datatype(Datatype *datatype);
+    Datatype(int size,MPI_Aint lb, MPI_Aint ub, int flags);
+    Datatype(char* name, int size,MPI_Aint lb, MPI_Aint ub, int flags);
+    Datatype(Datatype *datatype, int* ret);
     virtual ~Datatype();
     void use();
     void unuse();
@@ -135,7 +134,7 @@ class Type_Contiguous: public Datatype{
     int block_count_;
     MPI_Datatype old_type_;
   public:
-    Type_Contiguous(int size, int lb, int ub, int flags, int block_count, MPI_Datatype old_type);
+    Type_Contiguous(int size, MPI_Aint lb, MPI_Aint ub, int flags, int block_count, MPI_Datatype old_type);
     ~Type_Contiguous();
     void use();
     void serialize( void* noncontiguous, void *contiguous, 
@@ -151,7 +150,7 @@ class Type_Vector: public Datatype{
     int block_stride_;
     MPI_Datatype old_type_;
   public:
-    Type_Vector(int size,int lb, int ub, int flags, int count, int blocklen, int stride, MPI_Datatype old_type);
+    Type_Vector(int size,MPI_Aint lb, MPI_Aint ub, int flags, int count, int blocklen, int stride, MPI_Datatype old_type);
     ~Type_Vector();
     void use();
     void serialize( void* noncontiguous, void *contiguous, 
@@ -167,7 +166,7 @@ class Type_Hvector: public Datatype{
     MPI_Aint block_stride_;
     MPI_Datatype old_type_;
   public:
-    Type_Hvector(int size,int lb, int ub, int flags, int block_count, int block_length, MPI_Aint block_stride, MPI_Datatype old_type);
+    Type_Hvector(int size,MPI_Aint lb, MPI_Aint ub, int flags, int block_count, int block_length, MPI_Aint block_stride, MPI_Datatype old_type);
     ~Type_Hvector();
     void use();
     void serialize( void* noncontiguous, void *contiguous, 
@@ -183,7 +182,7 @@ class Type_Indexed: public Datatype{
     int* block_indices_;
     MPI_Datatype old_type_;
   public:
-    Type_Indexed(int size,int lb, int ub, int flags, int block_count, int* block_lengths, int* block_indices, MPI_Datatype old_type);
+    Type_Indexed(int size,MPI_Aint lb, MPI_Aint ub, int flags, int block_count, int* block_lengths, int* block_indices, MPI_Datatype old_type);
     ~Type_Indexed();
     void use();
     void serialize( void* noncontiguous, void *contiguous, 
@@ -199,7 +198,7 @@ class Type_Hindexed: public Datatype{
     MPI_Aint* block_indices_;
     MPI_Datatype old_type_;
   public:
-    Type_Hindexed(int size,int lb, int ub, int flags, int block_count, int* block_lengths, MPI_Aint* block_indices, MPI_Datatype old_type);
+    Type_Hindexed(int size,MPI_Aint lb, MPI_Aint ub, int flags, int block_count, int* block_lengths, MPI_Aint* block_indices, MPI_Datatype old_type);
     ~Type_Hindexed();
     void use();
     void serialize( void* noncontiguous, void *contiguous, 
@@ -215,7 +214,7 @@ class Type_Struct: public Datatype{
     MPI_Aint* block_indices_;
     MPI_Datatype* old_types_;
   public:
-    Type_Struct(int size,int lb, int ub, int flags, int block_count, int* block_lengths, MPI_Aint* block_indices, MPI_Datatype* old_types);
+    Type_Struct(int size,MPI_Aint lb, MPI_Aint ub, int flags, int block_count, int* block_lengths, MPI_Aint* block_indices, MPI_Datatype* old_types);
     ~Type_Struct();
     void use();
     void serialize( void* noncontiguous, void *contiguous, 
index 4d8d8f0..30f0f1b 100644 (file)
@@ -234,12 +234,18 @@ int PMPI_Type_ub(MPI_Datatype datatype, MPI_Aint * disp)
 }
 
 int PMPI_Type_dup(MPI_Datatype datatype, MPI_Datatype *newtype){
+  int retval = MPI_SUCCESS;
   if (datatype == MPI_DATATYPE_NULL) {
-    return MPI_ERR_TYPE;
+    retval=MPI_ERR_TYPE;
   } else {
-    *newtype = new Datatype(datatype);
-    return MPI_SUCCESS;
+    *newtype = new Datatype(datatype, &retval);
+    //error when duplicating, free the new datatype
+    if(retval!=MPI_SUCCESS){
+      (*newtype)->unuse();
+      *newtype = MPI_DATATYPE_NULL;
+    }
   }
+  return retval;
 }
 
 int PMPI_Op_create(MPI_User_function * function, int commute, MPI_Op * op)
index d6e0fcc..99c61fc 100644 (file)
@@ -113,16 +113,15 @@ Request::Request(){}
 Request::Request(void *buf, int count, MPI_Datatype datatype, int src, int dst, int tag, MPI_Comm comm, unsigned flags) : buf_(buf), old_type_(datatype), src_(src), dst_(dst), tag_(tag), comm_(comm), flags_(flags) 
 {
   void *old_buf = nullptr;
-//  s_smpi_subtype_t *subtype = static_cast<s_smpi_subtype_t*>(datatype->substruct);
-
-//  if((((flags & RECV) != 0) && ((flags & ACCUMULATE) !=0)) || (datatype->sizeof_substruct != 0)){
-//    // This part handles the problem of non-contiguous memory
-//    old_buf = buf;
-//    buf_ = count==0 ? nullptr : xbt_malloc(count*datatype->size());
-//    if ((datatype->sizeof_substruct != 0) && ((flags & SEND) != 0)) {
-//      subtype->serialize(old_buf, buf_, count, datatype->substruct);
-//    }
-//  }
+
+  if((((flags & RECV) != 0) && ((flags & ACCUMULATE) !=0)) || (datatype->flags() & DT_FLAG_DERIVED)){
+    // This part handles the problem of non-contiguous memory
+    old_buf = buf;
+    buf_ = count==0 ? nullptr : xbt_malloc(count*datatype->size());
+    if ((datatype->flags() & DT_FLAG_DERIVED) && ((flags & SEND) != 0)) {
+      datatype->serialize(old_buf, buf_, count);
+    }
+  }
   // This part handles the problem of non-contiguous memory (for the unserialisation at the reception)
   old_buf_  = old_buf;
   size_ = datatype->size() * count;
@@ -482,24 +481,24 @@ void Request::start()
     void* buf = buf_;
     if ((flags_ & SSEND) == 0 && ( (flags_ & RMA) != 0
         || static_cast<int>(size_) < xbt_cfg_get_int("smpi/send-is-detached-thresh") ) ) {
-//      void *oldbuf = nullptr;
+      void *oldbuf = nullptr;
       detached_ = 1;
       XBT_DEBUG("Send request %p is detached", this);
       refcount_++;
-//      if(old_type_->sizeof_substruct == 0){
-//        oldbuf = buf_;
-//        if (!smpi_process_get_replaying() && oldbuf != nullptr && size_!=0){
-//          if((smpi_privatize_global_variables != 0)
-//            && (static_cast<char*>(buf_) >= smpi_start_data_exe)
-//            && (static_cast<char*>(buf_) < smpi_start_data_exe + smpi_size_data_exe )){
-//            XBT_DEBUG("Privatization : We are sending from a zone inside global memory. Switch data segment ");
-//            smpi_switch_data_segment(src_);
-//          }
-//          buf = xbt_malloc(size_);
-//          memcpy(buf,oldbuf,size_);
-//          XBT_DEBUG("buf %p copied into %p",oldbuf,buf);
-//        }
-//      }
+      if(!(old_type_->flags() & DT_FLAG_DERIVED)){
+        oldbuf = buf_;
+        if (!smpi_process_get_replaying() && oldbuf != nullptr && size_!=0){
+          if((smpi_privatize_global_variables != 0)
+            && (static_cast<char*>(buf_) >= smpi_start_data_exe)
+            && (static_cast<char*>(buf_) < smpi_start_data_exe + smpi_size_data_exe )){
+            XBT_DEBUG("Privatization : We are sending from a zone inside global memory. Switch data segment ");
+            smpi_switch_data_segment(src_);
+          }
+          buf = xbt_malloc(size_);
+          memcpy(buf,oldbuf,size_);
+          XBT_DEBUG("buf %p copied into %p",oldbuf,buf);
+        }
+      }
     }
 
     //if we are giving back the control to the user without waiting for completion, we have to inject timings
@@ -792,7 +791,7 @@ void Request::finish_wait(MPI_Request* request, MPI_Status * status)
     req->print_request("Finishing");
     MPI_Datatype datatype = req->old_type_;
 
-    if(((req->flags_ & ACCUMULATE) != 0)/* || (datatype->sizeof_substruct != 0)*/){
+    if(((req->flags_ & ACCUMULATE) != 0) || (datatype->flags() & DT_FLAG_DERIVED)){
       if (!smpi_process_get_replaying()){
         if( smpi_privatize_global_variables != 0 && (static_cast<char*>(req->old_buf_) >= smpi_start_data_exe)
             && ((char*)req->old_buf_ < smpi_start_data_exe + smpi_size_data_exe )){
@@ -801,15 +800,12 @@ void Request::finish_wait(MPI_Request* request, MPI_Status * status)
         }
       }
 
-//      if(datatype->sizeof_substruct != 0){
-//        // This part handles the problem of non-contignous memory the unserialization at the reception
-//        s_smpi_subtype_t *subtype = static_cast<s_smpi_subtype_t*>(datatype->substruct);
-//        if(req->flags_ & RECV)
-//          subtype->unserialize(req->buf_, req->old_buf_, req->real_size_/datatype->size() ,
-//                               datatype->substruct, req->op_);
-//        xbt_free(req->buf_);
-//      }else 
-    if(req->flags_ & RECV){//apply op on contiguous buffer for accumulate
+      if(datatype->flags() & DT_FLAG_DERIVED){
+        // This part handles the problem of non-contignous memory the unserialization at the reception
+        if((req->flags_ & RECV) && datatype->size()!=0)
+          datatype->unserialize(req->buf_, req->old_buf_, req->real_size_/datatype->size() , req->op_);
+        xbt_free(req->buf_);
+      }else if(req->flags_ & RECV){//apply op on contiguous buffer for accumulate
           int n =req->real_size_/datatype->size();
           req->op_->apply(req->buf_, req->old_buf_, &n, datatype);
           xbt_free(req->buf_);